【データサイエンティスト養成講座】第3回問題(統計の基礎と可視化、ローレンツ曲線とジニ係数)
こんばんは。
「GCIデータサイエンティスト育成講座演習コンテンツ 公開ページ」の第3回の問題を解いたのでまとめます。 第3回問題の内容としては、基本的なPandasやmatlabの扱いを試す問題となっています。 自分は既に少し学んでいたので比較的簡単でした。 2重ループが必要なので若干コード自体の難易度は上がっていますが、基本的には指示通りに解くだけなので、その点ではむしろ今回が一番簡単なのかなと。
GCIデータサイエンティス育成講座の簡単な概要はこちらから。
第3回問題を解いてみた
問題概要
①基本統計量の算出と可視化 ②ローレンツ曲線の作図とジニ係数の算出 ※ジニ算出に使用する公式は与えられている。
今回は考え方というほどのものはないため、書いたコードを記載いたします。
実際書いたコード
短いですが以上となります。 ちなみに昨日はクロスバイクで60kmくらい走ったのでまだ疲れが抜けておらず、 夜8時ころくらいからずっと眠いです。運動楽しいからまたプチ旅には出る予定です。