こんにちは!データサイエンティストの青木和也(https://twitter.com/kaizen_oni)です!
今回の記事では、統計学の青本「自然科学の統計学」の第10章-演習問題4「平均個体数」について丁寧に解説していきたいと思います。
今回の問題は高校数学の数列の問題と大学数学の微分方程式をミックスしたような問題になっているので、学部生時代を思い出したい方はぜひチャレンジしていただけると幸いです!
問題文
<平均個体数>
フェラー・アレイ過程での時点$t$における平均個体数を
$$m(t) = \sum_{k = 1}^{\infty} k p_k(t)$$
とおく、このとき
$$m'(t) = (\lambda – \mu)m(t)$$
を示せ。
また初期条件
$$p_i(0) = 1,~~~p_k(0) = 0~~~(k \ne i)$$
のもとで、$m(t)$を求めよ。
東京大学教養学部統計学教室『自然科学の統計学』(東京大学出版社/2001) 第10章 P305~306
マルコフ連鎖とは?
確率変数の連なった集合$\{X_n\}$のことを確率過程という。
この確率過程における$X_n, X_{n+1}$について考えた時、確率変数$X_{n+1}$が直前の確率変数$X_n$にのみ依存する時、確率過程$\{X_n\}$はマルコフ性を持つという。
そして、マルコフ性を持つ確率過程$\{X_n\}$のことをマルコフ連鎖という。
マルコフ連鎖の詳細については、ビタビアルゴリズムの記事で詳細に説明しているので、そちらを参照ください。
フェラー・アレイ過程とは?
世界の人口について考えれば、人が生まれることがあれば、この世を去ることもあり、常に増加と減少をしながら人口は推移している。
このように、増加と減少を共に含む減少を表現するマルコフ連鎖のことを一般に出生死滅過程と呼ぶ。
ここで、増加に関するパラメータを$\lambda_k$、減少に関するパラメータを$\mu_k$とするとき、このパラメータが現在の総数$k$に比例するという過程をおいた出生死滅過程のことをフェラー・アレイ過程という。
ここで、人口総数を$L_t$とおいた時に、総数が$k$であるような確率を
$$p_k(t) = P(L_t = k)$$
とおく。
すると、条件付き確率や出生死滅過程の仮定から
$$p’_k(t) = -(\lambda_k + \mu_k)p_k(t) + \lambda_{k-1}p_{k-1}(t) + \mu_{k+1}p_{k+1}(t)$$
であることが導ける。
また、フェラー・アレイ過程は$\lambda_k$と$\mu_k$が総数$k$と比例するので、
$$\lambda_k = k\lambda$$
$$\mu_k = k\mu$$
とおくことができる。
$m'(t)$の導出の解説
$m(t)$を$t$について微分すると、以下の式のようになる。
$$m'(t) = \sum_{k = 1}^{\infty} k p’_k(t)$$
ここで、フェラー・アレイ過程は$\lambda_k = k\lambda, \mu_k = k\mu$とおくことより、$p’_k(t)$は以下の式のようになる。
$$p’_k(t) = -(k\lambda + k\mu)p_k(t) + (k-1)\lambda p_{k-1}(t) + (k+1)\mu p_{k+1}(t)$$
よって、先の$m'(t)$の式と$p'(t)$の式を合わせて考えると、
$$m'(t) = \sum_{k = 1}^{\infty} k p’_k(t)$$
$$= \sum_{k = 1}^{\infty} k\left( -(k\lambda + k\mu)p_k(t) + (k-1)\lambda p_{k-1}(t) + (k+1)\mu p_{k+1}(t) \right)$$
$$= \sum_{k=1}^{\infty} \left( -k^2 \lambda p_k(t) -k^2\mu p_k(t) + \lambda k(k-1) p_{k-1}(t) + \mu k(k+1)p_{k+1}(t)\right)$$
$$=\lambda \sum_{k=1}^{\infty} k^2 (p_{k-1}(t) – p_k(t)) + \mu \sum_{k=1}^{\infty}k^2(p_{k+1}(t) – p_k(t)) + \mu\sum_{k=1}^{\infty}kp_{k+1}(t) -\lambda \sum_{k=1}^{\infty}kp_{k-1}(t)$$
ここで、最右辺の式を項ごとに以下のように分割して計算を進める.
$$①=\lambda \sum_{k=1}^{\infty} k^2 (p_{k-1}(t) – p_k(t))$$
$$②=\mu \sum_{k=1}^{\infty}k^2(p_{k+1}(t) – p_k(t))$$
$$③=\mu\sum_{k=1}^{\infty}kp_{k+1}(t)$$
$$④=-\lambda \sum_{k=1}^{\infty}kp_{k-1}(t)$$
$\sum_{k=1}^\infty p_k(t)$について
ある時点$t$における総数の確率
$$p_k(t) = P(L_t = k)$$
について考えるとき、$\sum_{k=1}^\infty p_k(t)$はありうる総数のすべての確率を足し算することとなる。
よって、
$$\sum_{k=1}^\infty p_k(t)=1$$
①の計算
$$①=\lambda \sum_{k=1}^{\infty} k^2 (p_{k-1}(t) – p_k(t))$$
$$=\lambda \left( p_0(t) – p_1(t) + 4p_1(t) – 4p_2(t) + 9p_2(t) – 9p_3(t) + \cdots\right)$$
$$= \lambda \left(p_0(t) + 3p_1(t) + 5p_2(t) + 7p_3(t) + \cdots \right)$$
$$ = \lambda\left(p_0(t) + \sum_{k=1}^\infty (2k+1)p_k(t)\right)$$
$$= \lambda p_0(t) + 2\lambda \sum_{k=1}^\infty kp_k(t) + \lambda \sum_{k=1}^\infty p_k(t)$$
$$= \lambda p_0(t) + 2\lambda m(t) + \lambda$$
②の計算
$$②=\mu \sum_{k=1}^{\infty}k^2(p_{k+1}(t) – p_k(t))$$
$$= \mu \left( p_2(t) – p_1(t) + 4p_3(t) – 4p_2(t) + 9p_4(t) – 9p_3(t) + \cdots\right)$$
$$= \mu\left(-p_1(t) – 3p_2(t) – 5p_3(t) – 7p_4(t) – \cdots\right)$$
$$= -\mu \sum_{k=1}^\infty (2k-1)p_k(t)$$
$$= -2\mu \sum_{k=1}^\infty kp_k(t) + \mu \sum_{k=1}^\infty p_k(t)$$
$$ = -2\mu m(t) + \mu$$
③の計算
$$③=\mu\sum_{k=1}^{\infty}kp_{k+1}(t)$$
$$= \mu \left(\sum_{k+1}^\infty (k+1)p_{k+1}(t) – \sum_{k=1}^\infty p_{k+1}(t)\right)$$
ここで、{}内に$p_1(t) – p_1(t) = 0$を足してあげると
$$= \mu \left(p_1(t) + \sum_{k+1}^\infty (k+1)p_{k+1}(t) -p_1(t)- \sum_{k=1}^\infty p_{k+1}(t)\right)$$
$$= \mu\left( \sum_{k=1}^\infty kp_k(t) – \sum_{k=1}^\infty p_k(t)\right)$$
$$= \mu (m(t) – 1) = \mu m(t) – \mu$$
④の計算
$$④=-\lambda \sum_{k=1}^{\infty}kp_{k-1}(t)$$
$$=-\lambda \left( \sum_{k=1}^\infty (k-1)p_{k-1}(t) + \sum_{k=1}^\infty p_{k-1}(t)\right)$$
$$= -\lambda\left( 0\cdot p_0(t) + 1\cdot p_1(t) + cdots + p_0(t) + p_1(t) + p_2(t) + \cdots \right)$$
$$= – \lambda \left( \sum_{k=1}^\infty kp_k(t) + p_0 + \sum_{k=1}^\infty p_k(t)\right)$$
$$= – \lambda \left( m(t) + p_0(t) + 1\right)$$
$$= -\lambda m(t) – \lambda p_0(t) – \lambda$$
①、②、③、④の計算結果から$m'(t)$を求める。
$$m'(t) = \left(\lambda p_0(t) + 2\lambda m(t) + \lambda\right) + \left(-2\mu m(t) + \mu\right)$$
$$ + \left(\mu m(t) – \mu\right) + \left(-\lambda m(t) – \lambda p_0(t) – \lambda\right)$$
$$=(\lambda – \mu)m(t)$$
一般項$m(t)$の導出
次に、微分方程式$m'(t) = (\lambda – \mu)m(t)$と初期条件$p_i(0) = 1,~p_k(0) = 0~(k \ne i)$から一般項$m(t)$を求める。
微分方程式$f'(x) = af(x)$の一般解は$f(x) = Ce^{ax}$であることがわかっている。($C$は任意の定数)
よって、
$$m(t) = Ce^{(\lambda – \mu)t}$$
ここで、$m(0)$について考えると
$$m(0) = \sum_{k=1}^\infty kp_k(0) = 1\cdot p_1(0) + 2\cdot p_2(0) + \cdots + i\cdot p_i(0) + \cdots = i$$
また、先ほど求めた一般項$m(t)$より
$$m(0) = C e^{(\lambda – \mu) \times 0} = C$$
よって、
$$C=1$$
求める一般項$m(t)$は
$$m(t) = e^{(\lambda – \mu)t}$$
まとめ
今回の記事では、統計学の青本「自然科学の統計学」の第10章-演習問題4「平均個体数」について丁寧に解説しました。
一般項から、増加要因のパラメータと減少要因のパラメータが等しい時には平均個体数は1であり、増加要因の方が大きい場合は平均個体数は指数関数的に増加し、減少要因の方が大きい場合は平均個体数が指数関数的に減少するということがお分かりいただけたかと思います。
皆さんも、増加と減少のパラメータがわかっている場合には本書に記載のあるような出生死滅過程を使って、確率の時系列的な推移をシミュレーションしてみてください!
コメント