本シリーズの目標は,正しく意思決定をするために統計の考え方を学習することです.
私たちは日常生活において,いくつもの意思決定をしています.例えば,
これらの例を見ると,一般的には意思決定は次のように定義できます.
意思決定とは:
この定義から,正しく意思決定を行うためには,
という3つのステップが必要なことが分かります.
先程の投資の例では,2ステップ目までは完了しています.
株式・不動産・仮想通貨どれに投資すべきか
後は,目標達成に最も効果的な行為はどれかを知るだけです.つまり,3つの投資の中で最もお金を稼ぐものはどれかということです.
統計が有効に使えるのはこの最後のステップです.そこで私たちはこれから,
を学習していきます.
もちろん,正しい意思決定のためには
も非常に重要な,しかし見落とされがちなステップです.というのも多くの意思決定において,これらは明確になっていない・明確にしにくいことも多いからです.例えば「今日のデートに,どんな服を着ていくべきか」というときに,何が目標なのかはそれほど明らかではないですし,実行可能な行為を列挙することも難しいでしょう.
しかし,このシリーズではこれらはすでに分かっているものとして,行為の効果・有効性を知る方法だけに集中することにします.
今後しばらく,次の意思決定を考えます.
Dr.Kには今日5歳になった子供Lがいます.ちょうどこの日,Dr.Kは飲み薬Zを開発しました.これには,子供の身長を伸ばす効果があることが理論的に予想できました.しかし理論的にはそうでも,本当にそうなるのかはやってみなくては分かりません.もし,本当に身長を伸ばす効果があるのなら,子供Lに使ってやりたいですし,そうでないなら,副作用や薬を製造するコストを考えてLに使うことを避けたいところです.
ここでも定義に沿って,Dr.Kの意思決定を整理してみます.
最適な行為のために知るべきことは「薬Zが子供Lの身長を伸ばすかどうか(そして副作用やコストはそれに比べて小さいか)」です.
この薬Zの効果を調べるための完全に確実な方法は次のようなものです.
この方法は完全に確実な方法なのですが,これを理解するために,完全に確実でない素朴な方法を見ていくことにします.
素朴な方法の1つ目は,薬Zを実際にLに薬Zを毎晩飲ませて伸びを見ます.しかし,この場合,たとえ15年後にLの身長がよく伸びていたとしても,それがZの効果なのかは分かりません.自然によく伸びただけで,薬を飲んでいなくても同じくらい伸びたかもしれないからです.
この反論に答えるためには,薬を飲む場合と飲まない場合を比べる必要があることが分かります.そこでLの友達Mを使うことにします.
素朴な方法2では,Lには薬を飲ませ,Mには薬を飲ませないで,背の伸びを比べます.そして,20歳時にLの方が伸びているなら,それはLが薬を飲んだからだろう,と考えます.しかし,この方法も反論を免れません.なぜなら,LとMは違う人間ですから,2人の身長の伸びの違いは,薬を飲む飲まない以外の,例えば,次のような違いで生じる可能性があるからです.
だから,2人の身長の差を比べても,その差が薬の効果だと確実に言うことはできません.
それに,今までの話ではLに実際に薬を投与してしまっていますが,これだと薬を飲まないほうが良かったと分かった時に取り返しが付きません.しかし,Lとは別の人間を調べても,すでに述べたようにLとその人には色々な違いがあるために,その結果がLにそのまま適応できるとは限りません.
そこで,Lの複製L',L''をつくって,L'には薬を飲ませ,L''には飲ませないことにします.そして,2人には全く同じ生活を送らせて,背の伸びの差を調べることにします.こうすれば遺伝的にも,生活的にも2人は全く同じで,唯一の違いは薬の有無だけになります.よって,L'とL''の身長の伸びの差は薬の効果によるものと言えます.さらに彼らはLと同じ人間なので,良い方の結果はそのままLでも再現されます.
これで今までの問題がすべて解決されました.しかし,実はもう1つだけ問題があります.それは薬の飲む・飲まないを彼らが自覚しているということです.
つまり,薬を飲むL'は「これで身長が伸びやすくなる」と信じて生きることになりますし,飲まないL''は,「薬を飲まないからL'に比べて身長が伸びなくなる」と信じて生きることになります.身長が伸びる薬だと思うだけで,実際にはそんな効果がなかったとしても,彼らに影響を与えるのです.つまり,実はL'とL''は全く同じ生活を送っていなかったわけです.これでは2人の伸びの差は薬の効果ではなく,生活の違いによるものかもしれない,と反論することができてしまいます.
そこで,(例えば小麦をねって丸めただけの)全く効果のない,しかし見た目は薬Zにそっくりで区別できない錠剤を用意し,L''には薬Zを飲ませない代わりに,これを本当の薬Zだとして毎晩飲ませることにします.これをプラセボ(偽薬)といいます.こうすることで,L'とL''は,薬が純粋に与える効果以外には,全く同じ生活をする全く同じ人間になります.そこで,2人の身長の差は確実に薬の効果と考えることができます.
この方法には,反論の余地がありません.つまり,2人には薬の有無以外には何の差もないので,もし身長の伸びに差が生じれば,それは薬によるもの(=薬の効果)以外にありえません.この意味で,この方法は薬の効果を調べるための完全に確実な方法なのです.この方法で薬の効果を調べ,効果があればLに薬Zを飲ませ,なければ飲ませないことにすれば,絶対に間違いのない完璧な意思決定ができることになります.
重要なポイントは,効果を測定したい介入(今回の例では薬Dを投与すること)以外の要素をすべて同じにした2つを比べることで,2つの差が介入の効果と主張できるということです.
逆に介入以外の全てが同じでなければ,差は,介入以外の違いによるものかもしれないので,差があっても,介入の効果と断定することはできない,ということです.
この,介入以外の全てを同じにするという条件を満たすために,複製という手段を使ったのですが,これを実現する方法はもう1つあって,それは時を戻すという方法です.
つまり,介入を行って結果を測定し,時を介入前の同じ状態に戻して,介入を行わないで結果を測定すれば,介入以外の全てを同じにした2つの結果を比べることができます.
複製する方法も,時間を戻す方法も,介入以外の全てを同じにして差を調べるということが実現できているので,どちらも同じく完全に確実に介入の効果を測定することができます.
これらの完全に確実な方法の欠点は,それが実現不可能だということです.人間をコピーすることはできないし,時間を巻き戻すこともできないからです.しかし,これが可能だとして話を進めてみましょう.