こんにちは!データサイエンティストの青木和也(https://twitter.com/kaizen_oni)です!
今回の記事では、統計学の青本「自然科学の統計学」の第9章-演習問題8「リンドレーの3囚人問題」について丁寧に解説していきたいと思います。
ブログ主も、問題文を読んで「これの何が問題なん?」と頭を傾げてしまった、かつ少し条件付き確率についてこんがらがってしまったので、「なぜそのような結論になるのか」を丁寧に解説していきたいと思います。
問題文
<リンドレーの3囚人問題>
次のベイズの定理の適用につきコメントせよ.
—3人の囚人が幽閉されているとしよう.
3人の囚人の名前は、アラン(Alan)、バーナード(Bernard)、チャールズ(Charles)とする.
アランは、翌日3人のうち2人が処刑され、1人が釈放されることを知っていうが、3人のうち誰が釈放されるかについては全く分からない.
このような状況において、アランが看守に対し、「3人のうち2人が処刑されるのは確実である.バーナードとチャールズのうち少なくとも1人は処刑されるのは確実である.バーナードとチャールズのうち処刑されるものの名前を1人だけ教えてくれても、アランの釈放については全く情報を与えないはずだから、その名前を教えて欲しい」と言ったところ、看守は、アランの言い分に納得し、「バーナードは処刑される」と答えた.
アランはこれを聞いて、釈放される可能性があるのは、自分の他はチャールズのみになったので、自分が釈放される可能性が増えたと喜んだとする.
直感的には正しいように見えるが、この確率評価は根拠があるだろうか.
釈放されるべき人を、頭文字で、$A,B,C$とし、また$s$を「バーナードは処刑される」という言明(statement)だとすると、状況から、$P(s|A) = 1/2, P(s|B) = 0, P(s|C)=1$と仮定される.
事前確率は、$P(A) = P(B) = P(C) = 1/3$とする.
ベイズの定理から
$$P(A|s) = \frac{P(A)P(s|A)}{P(A)P(s|A) + P(B)P(s|B) +P(C)P(s|C)} = \frac{\frac13\times \frac12}{\frac13\times \frac12 + \frac13 \times 0 + \frac13 \times 1} = \frac13$$
ゆえに、$P(A) = P(A|s)$となり、上記の確率評価には根拠がない.
東京大学教養学部統計学教室『自然科学の統計学』(東京大学出版社/2001) 第9章 P274
確率の意味するところを整理しよう
釈放される囚人がランダムに決定されているのだとしたら、それぞれの囚人が釈放される確率が
$$P(A) = P(B) = P(C) = 1/3$$
であるのは問題ない。
また、$P(s|A)$は「Aが釈放される時に、『Bは処刑される』と言われる確率」であり、Aが釈放される状況においては、BとCが処刑されるのであるから、その状況で『Bが処刑される』という確率は$1/2$であると仮定している。
$P(s|B)$は「Bが釈放される時に、『Bは処刑される』と言われる確率」であるが、そんなことはあり得ないので、$P(s|B)=0$であることは確実である。
$P(s|C)$は「Cが釈放される時に、『Bは処刑される』と言われる確率」であるが、Aは「BとCのうち処刑される者の名前を1人だけ教えてくれ」と言っているので、Cが釈放される以上、『Bは処刑される』と言われるのは確実である。よって、$P(s|C)=1$となる。
解説
CHECK「確率の意味するところを整理しよう」で述べた前提には一つだけ誤ったものがある。
それは$P(s|A)$に対する仮定だ。
Aが釈放される状況においては処刑されるのはBとCであるが、そのような状況で「Bが処刑される」と看守がいう確率は本当に$1/2$だろうか。
ここで、たとえば$P(s|A)$については以下のようなパターンが考えられる。
なお、$P(s|A)$はAの主観的な認識に基づく確率であることに注意されたい。
看守はBのことを嫌っているとAは知っており、BとCが処刑される場合には必ず「Bが処刑される」と言う人間だと思っている | $P(s|A) =1$ |
Aは看守のことをよく知らないため、BとCが処刑される場合に「Bが処刑される」というかは分からない | $P(s|A) =\frac12$ |
看守はCのことを嫌っているとAは知っており、BとCが処刑される場合には必ず「Cが処刑される」と言う人間だと思っている | $P(s|A) = 0$ |
つまり、$P(s|A)$は看守の性格・思考によって決まる不定な確率なのである。
その前提に立って、$P(A|s)$を再計算すると次のようになる。
なお、式変形では$P(A) = P(B) = P(C) = \frac13$であることを利用している
$$P(A|s) = \frac{P(A)P(s|A)}{P(A)P(s|A) + P(B)P(s|B) +P(C)P(s|C)}$$
$$ = \frac{P(s|A)}{P(s|A) + P(s|B) +P(s|C)} = \frac{P(s|A)}{P(s|A) + 1}$$
よって、$P(s|A)$ごとに$P(A|s)$は以下のようになる
$P(s|A) = 1$のとき | $P(A|s) = \frac12$ |
$P(s|A) = \frac12$のとき | $P(A|s) = \frac13$ |
$P(s|A) = 0$のとき | $P(A|s) = 0$ |
まとめ
今回の記事では、統計学の青本「自然科学の統計学」の第9章-演習問題8「リンドレーの3囚人問題」について丁寧に解説していきました。
この問題の肝は、「確率的挙動をしないものに対して確率的前提をおいてはいけない」と言うことでした。
特に、Aが「看守はCのことが嫌い」という情報を知っているがゆえに「Bが処刑される」と言われた場合に「あ、Cは助かるんや、そしたら処刑されるんは自分やん」と確率的に悟ってしまう、というのは非常に面白いですね。
コメント