統計学挫折者にオススメという「完全独習 統計学入門」を読んでみた
# 入門 # 統計学
皆さんこんにちは、最近はようやくDjangoに慣れてきたと思ったらVue.jsとTypeScriptが増えてきててんやわんやしています。 Djangoで学んだこともアウトプットしないとですね。色々ありすぎるけど。
さて、そんな中ですが統計学も勉強しろというお達しが来ており「完全独習 統計学入門」を読みました。
この「完全独習 統計学入門」は、統計学初学者・挫折者にも優しい本と言うことでAmazonでもかなりの人気を誇る本となっています。
読んだのはどんな人?
統計学は大学で少し(一コマ)だけかじったことがある程度でほぼ初心者です。文系なので数学もセンター試験をひぃひぃ言いながら解いていました…
一応授業でかじったので実際に観測したデータは信頼に足るものなのか?というような計算はやろうと思えば可能です。 **なぜその検定・推定方法が機能するのか、そもそも標準偏差とは何?計算は出来るけどどういう意味?**ということは習ったような気もしますが、ちんぷんかんぷんです。
さて、それでは本の内容を見ていきたいと思います。
完全独習 統計学入門の内容
概要
以下がこの本の紹介文ですが、ほぼこの通りだなあという内容でした。 そのため、この内容に沿ってレビューを書いていきたいと思います。
▽本書は、 ●統計学を初めて学ぶ人 ●統計学を改めて学び直したいという人 ●何度も挫折して、いまだに身についてない(と感じている)人 ●今まさに落ちこぼれつつある人 に向けた、統計学の超入門書です。
(1)「これ以上何かを削ったら、統計学にならない」という、最小限の道具立て(ツール)と簡単さで書かれた「超入門書」
(2)確率の知識はほとんど使わない。微分積分もシグマも全く使わない。使う数学は、中学の数学(ルートと1次不等式)までだから、高校数学がわからなくても(忘れてしまっていても)大丈夫
(3)毎講に穴埋め式の簡単な練習問題がついているので、独習に最適
(4)第1部では初歩の初歩からスタートしながらも、「検定」や「区間推定」という統計学の最重要のゴールに最短時間で到達することを目指す
(5)第2部では、第1部の内容に厚みをつけ、統計学での免許皆伝でともいえるt分布を使った小標本の検定・区間推定に最も効率的にたどりつく。基本が理解できれば、相当なところまで理解できる
(6)標準偏差の意味が「体でわかる」よう、簡単な計算問題や具体例で徹底的に解説する
(7)株や投資信託などへの投資のリスクを、統計学から理解して金融商品にも強くなってもらう
▽本書は、「これ以上何かを削ったら、統計学にならない」というギリギリの道具立てと簡単さで書かれた「超入門書」です。
本書は2部構成となっています。第1部では初歩の初歩からスタートしながらも、「検定」や「区間推定」という統計学の最重要項目のゴールに最短時間で到達することを目指します。
▽「統計学」を効率よく、1ステップずつ理解するために、本書のスタンスは以下のようになっています。
●本書では、標準偏差(S.D.)を最も重要視する ●本書では「確率」をほとんど扱わない ●「95パーセント予言的中区間」を用いて説明 ●数学記号も数学公式もほとんど使わない(出てくるのは中学数学だけ) ●穴埋め式の簡単な練習問題で独習できる
読んでわかった特徴
●何度も挫折して、いまだに身についてない(と感じている)人
この点が本当にありがたいなあと思いました。正直統計の勉強って数式はそこまで難しくないので、丸暗記すればある程度出来てしまいます。 でもなんでそれをやっているのか、どんな意味を持っているのかなんて全くわからないという状態に陥りがちだと思います。
私自身がそうでした、標準偏差とか結構序盤にどの統計学の本でも出てきますよね?標準偏差求めるのなんて簡単ですよね。 でも、それがどういう意味を持ってその後の発展形に使われているかって分かりますか…? 私見ですが、私自身がそこで躓いた節もあるので、こういう部分をあまり理解せずにどんどん難しい部分に進んでいってしまっている教育方針が、理解が追いつかない大きな原因になっている部分かと思います。
(6)標準偏差の意味が「体でわかる」よう、簡単な計算問題や具体例で徹底的に解説する
また、このような文もありますが、本当にくどいくらい説明があります。笑 でも数式上の求め方ではなくなぜこの標準偏差という数値が重要で後々の計算にも使われるのか?という部分まできちんと落とし込んでくれています。
簡単に言えば、普通に考えたらどれくらいのばらつきが見られるかという数値が標準偏差です。 また、あくまで正規分布に従うという前提の元で標準偏差に1.96などの数値をかけることで信頼区間を求めることができるのですが、この部分もかなり噛み砕いて説明されています。 大学生くらいの時に読んでみたら少し人生違ったかもしれない
そして難しい部分はかなり端折ってます。これかなり大きな特徴かも。 厳密な話からは食い違いがある部分も結構あるそうですが、その分大筋の理解がしやすくなっているかと思います。
また、この本の重要な部分は統計学のベース中のベースとも言える標準偏差をきちんと理解することです。 そのために多くのページを割いていますしかなりわかりやすいです。それがこの本の1章です。 ただ、2章は結構数式をこねくり回して感覚ではなく数式ベースで物事を進めていく部分が多いです。(そもそもそうしないと無理だと思いますが…) 普通に教科書レベルの高校数学に食らいつける素養がないと、最後の方は厳しいのかなと思ったりはしました…
もし難しければ重要なのは1章なので1章だけきちんと読み込み、2章はふーん、と読み飛ばす感じがいいかと思います。
こんな人にはオススメできそう
・一度統計学を学んで、数字は求められるけど、なぜそうなるのかがわからずもやもやしている。
・統計学を全然触れたことがない(平均値の求め方から入るので事前知識はほぼ0でOKかと思います。)
・数式が嫌いだけど統計学学びたい人。多分理系大学生はやって損はない。 →これはちょっと微妙な部分はありますが、本書の重要な部分である1章は問題なく進めるかと思います。
こんな人はオススメ出来ないかも
・厳密な理論を学びたい人 →大枠を捉えるために、厳密な数式などはかなり省かれています。そのため本書だけでは学びきれない部分が多くあります。まあもちろんこの本読んでから他の本に行けばいいと思ってますが。
・中学校の数学で挫折した人 →どれだけ噛み砕いても、あくまで数字をベースに世界を推し量る学問だと感じました。中学レベルの数式は理解が出来て当然というスタンスです。(とはいえ他の数式がばんばん出てくるような統計学の本と比べると圧倒的に易しいと思います。)
・とにかくすぐに使えるものが知りたい、検定に合格したいだけという人 →教科書や公式ググりましょう。本書は同じものを感覚的に落とし込むようなものなので何回も同じものの説明があります。
最後に
統計学にふれる人は早い段階でこの本に触れると幸せになれるのかなあを思いました。 私自身もっと早く触れられていればと思う部分もあります。 AIエンジニアと胸を張って言えるようになるためにも、プログラミングと統計、両方頑張っていきたいと思います。