ビッグデータはどこまで必要なのか?(統計学が最強の学問である - 西内啓)


統計学が最強の学問である

統計学が最強の学問である

統計学の入門としてすごく分かりやすい

一応僕も理系なので、工学系で学ぶような統計は一通りやってきました。なのですがあまり仕事で使う機会も無くて「あー、こういう言葉昔に聞いたなー。」と言う程度だったのでそういう意味での復習と言うか、体系的に見直す意味でもとてもよかったです。釣りっぽいタイトルですが中身はすごく分かりやすい入門書って感じです。

特にP.170の表はとても分かりやすくて、

  • t検定
  • 回帰分析
  • 重回帰分析
  • χ二乗検定
  • ロジスティック回帰

なんかをどう使い分ければいいんだっけ、と言うのが整理されていて分かりやすかったです。

どの辺が最強なのか?

P.8に答えがあるので引用すると

どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるから

だそうです。いくつか条件はありますけど、結果の正しさを定量的に定義出来るようなものであれば確かに有用なことは間違い無いだろうなと思います。「経験と勘」だけを根拠にするよりよっぽど信じられるし、そもそもその「経験と勘」もちゃんと統計的に調べることで根拠を示せるよと言うのは本書でも言われていることです。

ビッグデータはどこまで必要なのか?

ビッグデータってよく聞きますけど、本当にどこまで必要なんだろうか、「1%の精度に数千万円をかけるべきか?」と言うのが本書でも書かれてます。当たり前ですけど、別にビッグデータを扱う事自体に意味は無いはずで。ビッグデータでしか解けないもの、分からないことがあるからこそ使う意味はあるんでしょう。ほどほどのデータの分析も満足にやってない会社が「これからはビッグデータや!!」とか言ってるとすると、「そういうこと言う前にExcelでやれよ…」と言う話だとは思います。

まぁ、新しいキーワードがあると物も売れるし、色々都合がいい人がいるのはよく理解出来るんですけど。(陰謀論的に言うと。)ほんとに必要なのは「ミスが許されない分野」とか「ビッグデータを使わずにやれる分析は全てやり尽した」とかそういうところなのでしょうか。だとするとどれだけの企業にビッグデータが本当に必要なんだろう…


でも、統計自体が面白いのは事実ですよね。ITが進歩して今まで統計学を適用出来なかったものがどんどん出来るようになってきていて、ただのデータの集まりから、見えなかった事実を導けるとすれば、最強かどうかはともかく素晴らしい技術だなと思います。それを牽引するデータサイエンティストは確かにすごいし、これからの需要が増えることも間違い無さそうです。

いわゆる「マーケティング」と呼ばれるような職種の人って、統計って不可欠なスキルなんじゃないでしょうか。ある程度の分析リテラシーが無いと騙される、と言うよりも知らないと根拠のあるデータが示せないような気がします。データサイエンティストと言う人たちが牽引して分析することがが広まっていった後は、きっと一般的な人でもそこそこ知識を持たなくてはいけないような世界になって、統計学が数学から独立して授業になったりするのかなぁ。「情報」の次の授業科目は、「情報」スキルが一番生きる分野な気がします。

と言うかこの著者の年齢が自分と2つしか違わないことにちょっと引いた。。どれだけ学識が広いんだ…