この時代、データ分析は必修じゃねぇの?『データ分析の力 因果関係に迫る思考法 (光文社新書)』書評・目次・感想・評価

[読みやすさ 9/10] 数式を使わずによくぞここまでと思う。 
[何度も読む 6/10] 巻末の参考図書にステップアップするべき。 
[読後感 7/10] さらに勉強したくなる一冊。 
[学び 9/10] データ分析が政策決定にまで関わっていることも学んだ。 
[斬新さ 8/10] 数式を使わないという努力に感服。

【Q1】どんな人にオススメ?

 データ分析に興味はあるが数式は苦手というあなた。
 データ分析を勉強したいのでとにかく分かり易い入門書を探しているあなた。
 特に勉強する気はないがデータ分析がどんなものか知りたいあなた。

【Q2】この本の弱みは?

  きっと数式を使えはもっと分かりやすかったんだろうなぁと思うところもあった。また、最後の参考図書の中級編がアメリカの大学の教科書になっていて、英語の苦手な人にはつらい。一冊ぐらいは日本語の本を入れるか著者が頑張って一冊書いてほしい。

【Q3】この本の強みは?

  とにかく分かりやすい。自身の参画したプロジェクトはもちろん、様々な具体例を挙げてデータ分析の世界を覗かせてくれる一冊。きっとあんなことやこんなこともできるんだろうなぁと勉強したい気持ちにさせてくれる。

データ分析の力 因果関係に迫る思考法 イメージ

データ分析の力 因果関係に迫る思考法 イメージ


【著者・伊藤公一朗さんの気になる著書リスト】

  

 

【『データ分析の力 因果関係に迫る思考法 (光文社新書)』目次と読書メモ】

第1章 なぜデータから因果関係を導くのは難しいのか 
 
事象xが事象yに影響を与えている可能性もあれば、逆にyがxに影響を与えている可能性。さらにvがx.yに影響を与えている可能性がある。vとなりうるものは無限に近くあり相関関係を見つけるのは簡単だが因果関係を見つけるのはとても難しい。

第2章 現実の世界で「実際に実験をしてしまう」――ランダム化比較試験(RCT) 
 
RCTは対象をランダムに分けて実験をする。RCTはデータを元にというより、データを作りにいく感じ。コストと手間がとてもかかる。データは多いほど効果的。
 
第3章 「境界線」を賢く使うRDデザイン 
 
RDデザインは70歳からの医療費の自己負担減額や、一地域の電気料金の値上げなど、実験者の行ったわけではない変化を利用してその変化がどのような影響を与えているかを推測する実験。あくまでもRCTと違い、断定は無理。

第4章 「階段状の変化」を賢く使う集積分 
 
積分析では累進的である所得税率などが納税者の収入にどのような影響を与えているか知ることができる。RDデザインとの違いは対象が自分の位置を主体的に選ぶことができること、つまり税率であれば所得を抑えたりできるということである。また、集積分析もまたRDデザイン同様、断定できない。

第5章 「複数期間のデータ」を生かすパネル・データ分析 
 
同じような複数期間にわたる変化を見せてきた2つのグループの一方に状況的変化を与えた場合に同じような変化に差が生まれて違う動きになった時に、状況的変化がグループに影響を与えたと言えるパネルデータ分析。使える場所がとても多い。
しかし、インパクト前のデータがなかったり、比較対象のデータを取っていなかったり、政府や企業の分析でも分析不備が多い。

第6章 実践編:データ分析をビジネスや政策形成に生かすためには? 
 
ウーバーは需要の逼迫状況によって価格が段階的に引き上げられる。その上で、RDデザインを利用して価格が上がった時の顧客の利用率をはじき出した。
オバマ政権ではどれだけ予算を取ったかで評価を決めることをやめ民主共和両党合同で統計学的に政策の成果で評価するという法律を通した。
これはトランプ政権でも持続すると思われる。何しろトランプはビジネスマン。
日本でもやっと実験が開始されたというところ。統計データによる政策決定はイデオロギーを超えるというてんでもメリットは大きい。
 
!しかしトランプ政権は政府予算の無駄を省くより、自身の支持率に対する影響を統計学的に調べさせていそう。ツイッターでのつぶやきもそれによってじしんの支持率の変化を見て実行を決めているとか。有権者はトランプのab実験に付き合わされているのかも。この前の米朝会談を板門店にしたのもつぶやいたら支持率にいい影響があったので実行することにしたとか!

第7章 上級編:データ分析の不完全性や限界を知る 
 
波及効果
例えば子供にパソコンを与えた時の学力向上効果を見るときに介入サンプルの子が非介入サンプルの子にパソコンを貸してしまうパソコンの効果が波及してしまう現象。対応としては介入、非介入を学校毎に分ければ波及効果を一定抑えられる。
出版バイアス
相関や因果関係がゼロだった場合、実験の結果には価値があっても、発表されないことが多い。
パートナー効果
そもそも実験に協力的という時点でバイアスがかかる。もしくは研究者が協力してくれそうなサンプルを意識的、もしくは無意識的に抽出してしまっている。
 
内的妥当性
サンプル内での妥当性。
外的妥当性
サンプル外での妥当性。

第8章 さらに学びたい方のために:参考図書の紹介 
 
初級編筆頭
原因と結果の経済学

 

「原因と結果」の経済学―――データから真実を見抜く思考法

「原因と結果」の経済学―――データから真実を見抜く思考法

 

 

他3冊
 
中級編
アメリカの大学の教科書(全編英語・・・涙)