【データサイエンティスト養成講座】第3回問題(統計の基礎と可視化、ローレンツ曲線とジニ係数)


こんばんは。

GCIデータサイエンティスト育成講座演習コンテンツ 公開ページ」の第3回の問題を解いたのでまとめます。 第3回問題の内容としては、基本的なPandasやmatlabの扱いを試す問題となっています。 自分は既に少し学んでいたので比較的簡単でした。 2重ループが必要なので若干コード自体の難易度は上がっていますが、基本的には指示通りに解くだけなので、その点ではむしろ今回が一番簡単なのかなと。

GCIデータサイエンティス育成講座の簡単な概要はこちらから。

第3回問題を解いてみた

問題概要

①基本統計量の算出と可視化 ②ローレンツ曲線の作図とジニ係数の算出 ※ジニ算出に使用する公式は与えられている。

今回は考え方というほどのものはないため、書いたコードを記載いたします。

実際書いたコード

短いですが以上となります。 ちなみに昨日はクロスバイクで60kmくらい走ったのでまだ疲れが抜けておらず、 夜8時ころくらいからずっと眠いです。運動楽しいからまたプチ旅には出る予定です。