「自然科学の統計学」第1章演習問題1-二項分布を丁寧に解説してみた

統計基礎
元教師
元教師

こんにちは!データサイエンティストの青木和也(https://twitter.com/kaizen_oni)です!

今回の記事では、統計学の青本「自然科学の統計学」の第1章-演習問題1「二項分布」を丁寧に解説していきたいと思います。

確率分布の期待値/分散計算の基礎的な内容を扱っているので、皆さんもぜひ本演習から他の確率分布の期待値/分散を求めていただけると幸いです!

問題文

<二項分布>

二項分布Bi(n,p)の期待値と分散を、定義に従って導け.

東京大学教養学部統計学教室『自然科学の統計学』(東京大学出版社/2001) 第1章 P22

離散確率分布の期待値と分散の定義

離散的な確率変数において、取りうる値がxi, i=0,1,2,であるとき確率関数pi

pi=P(X=xi)  (i=0,1,2,)

で定義する。この時、期待値E(X)と以下の式で定義する。

E(X)=ipixi

また、μ=E(X)とすると分散V(X)は以下の式で定義する。

V(X)=E{(Xμ)2}=ipi(xiμ)2

また、上式を変形すると、以下の式が求められる

V(X)=E{(Xμ)2}=E(X2)μ2

二項分布の確率関数

ある試行が成功する確率をp、失敗する確率をq=1pとすると、n回中k回成功する確率p(x)は以下の式で与えられる。

p(x)=nCkpk(1p)nk

組み合わせnCk

n個からk個を取り出す組み合わせの総数nCkは次のように計算する

nCk=n!(nk)!k!

二項定理とは?

任意の有理数a,bと任意の正整数nについて、以下の式を二項定理と呼ぶ

(a+b)n=k=0nnCkankbk

E(X)の導出

E(X)=k=1nknCkpkqnk

=k=1nn!(nk)!k!kpkqnk

ここで、

kk!=kk(k1)1=1(k1)1

であるから、

E(X)=k=1nn!(nk)!(k1)!pkqnk

=k=1nn(n1)!(nk)!(k1)!pkqnk

=k=1nn1Ck1npkqnk

=npk=1nn1Ck1pk1qnk

=npk=0nn1Ckpkqnk1

=np(p+q)n1=np×1n1=np

V(X)の導出

V(X)を求めるために、μ=npが分かっているのでE(X2)が分かればいい。

先ほどの計算を利用すると、E(X2)を求めるためにE[X(X1)]をまず求める。

E[X(X1)]=k=1nk(k1)nCkpkqnk

=k=1nn!(nk)!k!k(k1)pkqnk

=k=1nn!(nk)!(k2)!pkqnk

=n(n1)k=1n(n2)!(nk)!(k2)!pkqnk

=n(n1)k=1nn2Ck2pkqnk

=n(n1)p2k=1nn2Ck2pk2qnk

n2Ck1において、k=0,1の場合を考えるとn2C1のようになりますが、これは文章にすると「n2個の中から1個を取り出す」という意味となり、そのような組み合わせは存在しないことが分かります。

つまり、n2C1=n2C2=0となります。

余談ですが、nC0=1はあらかじめ定められています。

n2C1=0は以下のようなロジックでも導くことができます。

(n1)!について考える

n!n=(n1)!()

であることは自明と考えられます。

(1)!について考える

()式にn=0を代入すると、

(1)!=0!0=10

となり、(1)!は無限大に発散することがわかります。

n2C1について考える

n2C1=(n2)!(n1)!(1)!

である、分母に無限大があることから、

n2C1=0

となることがわかります。

よって、

E[X(X1)]=n(n1)p2k=2nn2Ck2pk2qnk

=n(n1)p2k=0n2n2Ckpkqnk2

=n(n1)p2(p+q)n2=n(n1)p2

よって、

E[X(X1)]=n(n1)p2

E(X2)E(X)=n(n1)p2

E(X2)=n(n1)p2+E(X)=n(n1)p2+np

よって、

V(X)=E(X2)μ2=n(n1)p2+np(np)2

=n2p2np2+npn2p2=npnp2=np(1p)

まとめ

今回の記事では、統計学の青本「自然科学の統計学」の第1章-演習問題1「二項分布」を丁寧に解説しました!

本書には略解しか書いていませんが、意外に厳密に計算をしようとすると組み合わせnCkkが負の数にぶち当たったりなど、本書とはまた違った学びがあったかと思います。

本記事が皆さんの独学のお役に立てていれば幸いです!

コメント

タイトルとURLをコピーしました