確率の話がしたくなった 2

前回の続き

nisshiee.hatenablog.jp

おさらい

まぁ「前回の記事読んでください」って話ではあるんだけど、ちょっと図なんかを交えながらおさらいする。

\( P(S) = 0.8, P(R) = 0.2 \) ってのは図で表すとこんな感じ。ここまでは特筆すべきことはない。見たまんま。

f:id:nisshiee:20151103201356p:plain

で、「西の空が黒い雲に覆われている」という情報を得て確率が変化する例を、この図に書き込んでみる。

f:id:nisshiee:20151103201357p:plain

左半分が「晴れ」、右半分が「雨」というところは一緒。加えて、上半分が、「西の空が晴天」、下半分が「西の空が黒い雲に覆われている」という事象を表している。図上の \( (1) 〜 (4) \) を用いると、

\begin{equation} \left\{ \begin{array}{rclcl} P(S) & = & \frac{(1) + (3)}{(1) + (2) + (3) + (4)} & = & 0.8 \\ P(R) & = & \frac{(2) + (4)}{(1) + (2) + (3) + (4)} & = & 0.2 \\ P(S|C) & = & \frac{(3)}{(3) + (4)} & = & 0.3 \\ P(R|C) & = & \frac{(4)}{(3) + (4)} & = & 0.7 \end{array} \right. \end{equation}

となる。つまり、「西の空が黒い雲に覆われている」という情報を得た時点で、図の下半分だけを見れば良いことになり、分母が \( (3) + (4) \) に狭まったわけだ。

同時確率

さてここでもう一つ、同時確率という新しい概念を導入する。

同時確率とは、2つの事象が同時に発生する確率のこと。例えば、西の空や明日の天気に関する情報を一切得ていない条件下で、「今西の空が黒い雲に覆われており、かつ、明日の天気が雨である確率」といったものを同時確率と言い、以下のように表す。

\begin{equation} P(C \cap R) \end{equation}

「同時」とは言っても、「時間軸上で同時刻」という意味ではないので注意。「両方起こる」という意味だと捉えると良いかもしれない。

おさらいで出した図を使って、式で表すとこうなる。

\begin{equation} P(C \cap R) = \frac{(4)}{(1) + (2) + (3) + (4)} \end{equation}

違う例で、例えばサイコロを2回ふって、1回目が1であるという事象と、2回目が1であるという事象が両方起こる確率は、 \( 1/6 \times 1/6 = 1/36 \) って言ってるのが同時確率(この例だとイメージしやすいかな)。

重要なのは、同時確率は可換であるということ。つまり、

\begin{equation} P(C \cap R) = P(R \cap C) \end{equation}

である。

ベイズの定理

さて、やってまいりましたベイズの定理。とは言っても、実は身構えるほどのものじゃない。

ベイズの定理とは、条件付き確率と同時確率の関係を表した定理で、以下の式で表される。

\begin{equation} P(C \cap R) = P(C) \times P(R|C) \end{equation}

改めて、図を見ながら考えると、この式の表す意味なんて「え?当たり前じゃない?」って言いたくなるレベル。

f:id:nisshiee:20151103201358p:plain

「右下になる確率は、下半分になる確率と、下半分だけ見たときに右側になる確率を掛けたもの」って言ってるだけ。

※ 教科書とかだと移項して割り算の形で表現されてるものが多い。でも掛け算の形の方が、簡単だし、意味と絡めて覚えやすいでしょw

ベイズの定理の応用

確率の話をすると、いつも出てくるこの「ベイズの定理」ってやつ。式の意味は大したことないのに、何がすごいんだって聞かれたら、応用が効くからなんだ。どんな応用ができるかって言うと、条件付き確率の \( | \) の左右をひっくり返せる。

ベイズの定理と、同時確率が可換であることから、

\begin{equation} P(A) \times P(B|A) = P(A \cap B) = P(B \cap A) = P(B) \times P(A|B) \end{equation}

よって、

\begin{equation} P(B|A) = \frac{P(B) \times P(A|B)}{P(A)} \end{equation}

条件付き確率でも同時確率でもない \( P(A), P(B) \) は分かっている or 計算しやすいことが多いので、条件付き確率が分かると、ひっくり返した条件付き確率も計算できることが多いのだ。

モンティ・ホール問題

というわけで、モンティ・ホール問題を解きたいわけだが、長くなってしまったので次回にしよう。

モンティ・ホール問題の確率計算は、まさにこの、条件付き確率のひっくり返しによって完結する。