読者です 読者をやめる 読者になる 読者になる

確率の話がしたくなった

いきさつ

seagull.hateblo.jp

モンティ・ホール問題。

とかの話がまた出てきたのもきっかけなんだけど、まぁ最近「人工知能」ってワードがバズってきてるし、確率の話しとかないと、会社とかでも話が噛み合わなかったりするんだよね。

なぜ「確率」と「人工知能」が関係するのかって、イメージしづらいかもしれない。でも人工知能という分野を勉強したら、そんなのあえて言及するまでもない当たり前のことなんだ。でもどのように関係するのかを話そうにも、やっぱり「確率」のことをちゃんと知っている前提がないと説明できない。

なので、学生時代*1を思い出しつつ、復習しながら確率について書いていこう。

まずは天気の予測でもしよう

ひとまず簡単のため、「くもり」とか「曖昧な天気」とかはなしにして、世間では天気は「晴れ」か「雨」の2択で語られるものとしよう。

さて、明日の天気を予測したい。

でもあなたは地下街にいて空の様子を見ることもできないし、天気予報といった類の情報にもアクセスできないとする。そんな状況で、「明日は晴れですか?雨ですか?」と聞かれたらなんと答えるだろうか。

そりゃ「晴れ」と答えるだろう。

だって、あなたは経験的に、1年を通したら8割ぐらいの日は晴れで、雨の日は2割ぐらいだと知っているのだから。「晴れ」と言っておけば、8割当たる。

「ある日の天気が晴れである」という事象をS、「雨である」という事象をRとすれば、あなたは経験則から、

\begin{align} P(S) &= 0.8 \\ P(R) &= 0.2 \end{align}

であることを知っているということ。これが確率である。

外に出て空を見上げてみる

さて、次にあなたは地下街から外に出て、空を見上げてみたとしよう。すると、西の空が黒い雲に覆われていた。あなたは、「西の空が黒い雲に覆われているならば、明日は7割の確率で雨」であることを経験的に知っている。

明日雨が降る確率はもともと0.2であった。でも、外に出て空を見上げたら0.7になった。確率が変化した。

何が起こったのだろうか。もちろん、あなたが超能力で気候を操作したわけではない。変化したのは、「西の空が黒い雲に覆われているという情報を得た」ということだ。情報を得ると、確率は変化する。*2

情報を得る前の確率を事前確率、情報を得て変化した後の確率を事後確率という。

「西の空が黒い雲に覆われている」という事象をCとすれば、「西の空が黒い雲に覆われているという情報に基づく確率」を以下のように書く。

\begin{align} P(S|C) &= 0.3 \\ P(R|C) &= 0.7 \end{align}

学校の数学で「条件付き確率」という名前で習ったやつだ。

逆に、昨日を予測する

1つ、気をつけなければいけないことがある。「条件付き確率は因果関係を表現しない。表現するのは相関関係だけである。」という点だ。だから、西の空が黒い雲に覆われていると次の日に雨が降る頻度が高いということはわかるが、西の空の黒い雲が翌日の雨の原因であるとは言っていない。

しかしこのことは逆に、条件付き確率はただ相関関係を表しているだけなので、時系列に縛られない、とも言える。

例えば今日雨が降っているとする。あなたは昨日空を見上げなかったので昨日西の空が黒い雲に覆われていたかどうかわからないが、その確率については議論できる。「今日雨が降っているという情報に基づく、昨日西の空が黒い雲に覆われている確率」は、同じように条件付き確率を使って

\begin{equation} P(C|R) \end{equation}

と表せる。時系列は逆転しているが、これも許される。

勘違いしてはいけないが、\( P(R|C) \)が高いからと言って、\( P(C|R) \)が高いとは限らない。雨が降る前に西の空が黒い雲に覆われるという兆候が出てくれることは、珍しいかもしれない。

モンティ・ホール問題

さて、少しだけ、モンティ・ホール問題の話に戻ろう。

3つの扉のうち、各扉が当たりである確率はそれぞれ 1/3 である。これが事前確率だ。しかし、司会者が1つ、ハズレの扉を開けてみせることにより、実は回答者は情報を得ているのだ。この情報を得た後の事後確率はどうなるだろうか。これがモンティ・ホール問題である。

続き

くっそ長い記事は書くのも読むのもつらいので、今回はここまでにしよう。次回ぐらいに「ベイズの定理」まで行けるんじゃないか?ベイズの定理まで行けば、モンティ・ホール問題の事後確率も計算できる。

もし続きが気になる人がいたら、僕のやる気が出ることを祈ってください。*3

*1:もう5年も前か・・・・

*2:ちなみに、「情報が確率に影響を与える程度のことを情報量と定義して扱う理論」を「(シャノンの)情報理論」という。その話は機会があれば。

*3:僕は過去にブログがあまり続いたことはない