「自然科学の統計学」第9章演習問題8-リンドレーの3囚人問題を丁寧に解説してみた

統計基礎
元教師
元教師

こんにちは!データサイエンティストの青木和也(https://twitter.com/kaizen_oni)です!

今回の記事では、統計学の青本「自然科学の統計学」の第9章-演習問題8「リンドレーの3囚人問題」について丁寧に解説していきたいと思います。

ブログ主も、問題文を読んで「これの何が問題なん?」と頭を傾げてしまった、かつ少し条件付き確率についてこんがらがってしまったので、「なぜそのような結論になるのか」を丁寧に解説していきたいと思います。

問題文

<リンドレーの3囚人問題>

次のベイズの定理の適用につきコメントせよ.

—3人の囚人が幽閉されているとしよう.

3人の囚人の名前は、アラン(Alan)、バーナード(Bernard)、チャールズ(Charles)とする.

アランは、翌日3人のうち2人が処刑され、1人が釈放されることを知っていうが、3人のうち誰が釈放されるかについては全く分からない.

このような状況において、アランが看守に対し、「3人のうち2人が処刑されるのは確実である.バーナードとチャールズのうち少なくとも1人は処刑されるのは確実である.バーナードとチャールズのうち処刑されるものの名前を1人だけ教えてくれても、アランの釈放については全く情報を与えないはずだから、その名前を教えて欲しい」と言ったところ、看守は、アランの言い分に納得し、「バーナードは処刑される」と答えた.

アランはこれを聞いて、釈放される可能性があるのは、自分の他はチャールズのみになったので、自分が釈放される可能性が増えたと喜んだとする.

直感的には正しいように見えるが、この確率評価は根拠があるだろうか.

釈放されるべき人を、頭文字で、$A,B,C$とし、また$s$を「バーナードは処刑される」という言明(statement)だとすると、状況から、$P(s|A) = 1/2, P(s|B) = 0, P(s|C)=1$と仮定される.

事前確率は、$P(A) = P(B) = P(C) = 1/3$とする.

ベイズの定理から

$$P(A|s) = \frac{P(A)P(s|A)}{P(A)P(s|A) + P(B)P(s|B) +P(C)P(s|C)} = \frac{\frac13\times \frac12}{\frac13\times \frac12 + \frac13 \times 0 + \frac13 \times 1} = \frac13$$

ゆえに、$P(A) = P(A|s)$となり、上記の確率評価には根拠がない.

東京大学教養学部統計学教室『自然科学の統計学』(東京大学出版社/2001) 第9章 P274

確率の意味するところを整理しよう

釈放される囚人がランダムに決定されているのだとしたら、それぞれの囚人が釈放される確率が

$$P(A) = P(B) = P(C) = 1/3$$

であるのは問題ない。

また、$P(s|A)$は「Aが釈放される時に、『Bは処刑される』と言われる確率」であり、Aが釈放される状況においては、BとCが処刑されるのであるから、その状況で『Bが処刑される』という確率は$1/2$であると仮定している。

$P(s|B)$は「Bが釈放される時に、『Bは処刑される』と言われる確率」であるが、そんなことはあり得ないので、$P(s|B)=0$であることは確実である。

$P(s|C)$は「Cが釈放される時に、『Bは処刑される』と言われる確率」であるが、Aは「BとCのうち処刑される者の名前を1人だけ教えてくれ」と言っているので、Cが釈放される以上、『Bは処刑される』と言われるのは確実である。よって、$P(s|C)=1$となる。

解説

CHECK「確率の意味するところを整理しよう」で述べた前提には一つだけ誤ったものがある。

それは$P(s|A)$に対する仮定だ。

Aが釈放される状況においては処刑されるのはBとCであるが、そのような状況で「Bが処刑される」と看守がいう確率は本当に$1/2$だろうか。

ここで、たとえば$P(s|A)$については以下のようなパターンが考えられる。

なお、$P(s|A)$はAの主観的な認識に基づく確率であることに注意されたい。

看守はBのことを嫌っているとAは知っており、BとCが処刑される場合には必ず「Bが処刑される」と言う人間だと思っている$P(s|A) =1$
Aは看守のことをよく知らないため、BとCが処刑される場合に「Bが処刑される」というかは分からない$P(s|A) =\frac12$
看守はCのことを嫌っているとAは知っており、BとCが処刑される場合には必ず「Cが処刑される」と言う人間だと思っている$P(s|A) = 0$

つまり、$P(s|A)$は看守の性格・思考によって決まる不定な確率なのである。

その前提に立って、$P(A|s)$を再計算すると次のようになる。

なお、式変形では$P(A) = P(B) = P(C) = \frac13$であることを利用している

$$P(A|s) = \frac{P(A)P(s|A)}{P(A)P(s|A) + P(B)P(s|B) +P(C)P(s|C)}$$

$$ = \frac{P(s|A)}{P(s|A) + P(s|B) +P(s|C)} = \frac{P(s|A)}{P(s|A) + 1}$$

よって、$P(s|A)$ごとに$P(A|s)$は以下のようになる

$P(s|A) = 1$のとき$P(A|s) = \frac12$
$P(s|A) = \frac12$のとき$P(A|s) = \frac13$
$P(s|A) = 0$のとき$P(A|s) = 0$

まとめ

今回の記事では、統計学の青本「自然科学の統計学」の第9章-演習問題8「リンドレーの3囚人問題」について丁寧に解説していきました。

この問題の肝は、「確率的挙動をしないものに対して確率的前提をおいてはいけない」と言うことでした。

特に、Aが「看守はCのことが嫌い」という情報を知っているがゆえに「Bが処刑される」と言われた場合に「あ、Cは助かるんや、そしたら処刑されるんは自分やん」と確率的に悟ってしまう、というのは非常に面白いですね。

コメント

タイトルとURLをコピーしました