データサイエンスとデータドリブン経営

データサイエンス/デジタルマーケティング/データドリブン経営の書籍紹介・感想

「データ分析の力 因果関係に迫る思考法」 読書メモ

「原因と結果の経済学」に続いて、一般向けの因果推論の入門書を読みます。 

 

 

内容メモ

 

第一章 因果関係を立証するのが難しい理由

・他の要因が影響していた可能性がある。

・逆の因果関係だった場合もある。

 

第二章 ランダム化比較試験(RCT)

ドナルド・ルービン(Donald Rubin)

潜在的な結果を用いて因果関係を考える方法(potintial outcome approach)」

 

介入効果(treatment effect)=Y1 - Y0

Y1:介入を受けた場合の結果

Y0:介入を受けなかった場合の結果

 

「実際には起こらなかった潜在的結果(counterfactual potentail outcome)」

=「反事実の潜在的結果」

=「反実仮想的事実」

 

「平均介入効果(ATE:Average Treatment Effect)」

 

・記述統計のバランスチェック(記述統計の平均値が介入グループと比較グループで似たような値になっているか)

・平均の差は統計的にゼロなのか?(標準誤差を使った検定)

 

単純ランダム化法(simple randomization) 

ブロック・ランダム化法(block randomization) 

 

第三章 RDD(Regression Discontinuity Design) 回帰不連続デザイン

自然実験(疑似実験)の1つ。

不連続(discontinuity)、境界線(borderline)

 

例:年齢の境界(70歳医療)、地理的境界(州)

 

前提条件

・他の要素が境界線上で非連続的にジャンプしていないかを検証する。

・データの主体が横軸の変数を恣意的に操作できない。 

 

境界線付近以外に適用できるか?(外的妥当性)

 

 第四章 集積分

 階段状の変化を使い因果関係に迫る手法。

・何らかのインセンティブ(商品価格、税金、補助金)が階段状。

・階段状で変化するのは分析で明らかにしたい要素のみで、他の要素は階段付近で非連続的に変化しないこと。

 

第五章 パネル・データ分析

差の差分法(Difference in differences methods)、固定効果推定法(Fixed effect estimation)とほぼ同じ。

 

「平行トレンドの仮定(parallel trend assumption)」

 

.・介入開始前に同じ動きをしていること。

・同時期に介入グループだけに影響を与える別の出来事がないこと。(共通ショックは除く。) 

 

第六章 実践編

・スーパーの価格表示は税込・税抜

・電力の価格

・ウーバーの価格による需要曲線