二項分布

n回の試行を行う。 i回目に成功すれば1,失敗すれば0の値となる確率変数xiを考える。 成功する確率をPで試行で変わらないとするとき、n回の独立な試行を行った時の成功数(X=x1+x2+・・・+xn)の分布である。

各試行における成功確率 p は一定であり、このような試行を、ベルヌーイ試行と呼ぶ。

確率変数 X がパラメータ n、p の二項分布に従うとき、X ~ B(n, p) と記述する。

n回の試行を行った時x回成功する確率は、

P(x)=nCx・p^x・(1-p)^(n-x)
nCx = n!/(x!・(n-x)!) :n個からx個を取り出す場合の数

の二項分布に従う。

平均と分散

X ~ B(n, p) ならば、

Xの期待値: E[X] = np 
Xの分散 :var(X) = np(1 − p) 

例題:感染数

ある病気の感染者の確率が、pの時、n人の人を抽出した時、病気にかかっている人の数は、B(n, p)と見てよい。例えば1000人の町で100人以上病気である確率は、Pr(x>100)で計算できる。

正規分布との関係

np および n(1 − p) が5よりも大きい場合、B(n, p)に対する良好な近似として正規分布がある。 平均μx,分散Vxの正規分布をN[μx,Vx]で表わす。

二項分布は、n--->大の時、N[np,np(1-p)]の正規分布で十分に近似できる。

中心極限定理

xが平均μ,分散V=σ^2の確率分布の時、独立にn回抽出した標本分布の平均値は、N[μ,σ^2/n]に従う。

この定理は、独立同分布の平均値の収束定理として重要である。

大数の法則

ヤコブ・ベルヌーイ(Jacques Bernoulli 1654-1705)は確率論の基礎になる大数の法則を見つけた

硬貨を投げる際、投げる回数を多くすれば表と裏が出る確率は1/2に集中してくる、それより大きくなったり小さくなったりすることは無い。またサイコロを投げた場合、回数が多くなればある目の出る確率は1/6である。このような現象は確率の本質的な性格で大数の法則と呼ばれる。ベルヌーイはスイスの数学者で、名著「推測法」で新奇さ、素晴らしい実用性、極端な難解さを兼ね備えたベルヌーイの定理、一般的には「大数の法則」と呼ばれるものを発表して確率論の基礎を造った。

  • 弱大数の法則

期待値 μ であるような可積分独立同分布確率変数列 X1, X2, ... の平均 x=Σxi/n のとる値は、十分大きな n まで考えれば、ほとんどの n でおおよそ μ である([Xn] が μ から大きく外れるような n の現れる確率は n を無限に大きくすると 0 に近づく)

n-->無限大 ならば x=Σxi/n --->μ
  • 強大数の法則 n → ∞ とするとき、[Xn] は μ にほとんど確実に(almost surely, 確率 1 で)収束する。
  • サイコロの平均値: サイコロを繰り返し投げるとき、n 回目に出た目を Xn とする。各Xn は 1 〜 6 の整数値をそれぞれ の確率でとり、その期待値は 3.5 である。また、確率変数列の平均 の値は n → ∞ とすれば 3.5 に集中する。このことから n が十分大きければ Xn はそれぞれの値を等しい比率でとり、たとえば 6 回に 1 回の割合で 1 が現れるということがわかる。
  • 大数の法則が成立しない場合

母分布の平均が存在することを前提としている。コーシー分布は、期待値や分散(あるいはより高次のモーメント)が定義されない分布の例として知られる。このような分布では、大数の法則が成立しない。

ド· モアブル= ラプラスの定理

0 < p < 1, u に対してμ = np, σ = √npq (q = 1 − p) とし、x = σu + μ (u = (x − μ)/σ) とするとき、p, u を固定したままn → ∞ とすると

P(x)=nCx・p^x・(1-p)^(n-x) --->(1/√2Π)・EXP(-u^2/2)

ド· モアブル= ラプラスの定理はスターリングの公式を使って導き出すことができる。

意味は、n が大きいとき、二項分布B(n, p) は正規分布N(μ, σ2) (μ = np, σ = √npq) で近似できることを表わす。

  • 証明

二項分布・σ の対数をとる。q=1-pとすると

log(σ・二項分布)=logσ+n! − log x! − log(n − x)! + x log p + (n − x) log q

一方、スターリングの公式は、n-->大の時 n! ≒ (n/e)^n ・√(2Πn) 。この≒の意味は両辺の比が1 に収束することを意味する。

スターリングの公式よりm → ∞ のときは

log(m!) ≒ logm^m√2πm・exp(−m)
        ≒(1/2)log 2π +(m +1/2)logm − m

であるので 3つの階乗n!、x!、(n − x)! に上式を適用してlog(二項分布)を整理する。

log(σ・二項分布)=(1/2)log(npq)-(1/2)log(2Π)-(1/2)logn+(x+1/2)log(n/x)
         +(n-x+1/2)log(n/(n-x))+ x log p + (n − x) log q
    =-(1/2)log(2Π)+(1/2)[logp+log(n/x)]+1/2[logq+log(n/n-x)]
     +x(logp+log(n/x)]+(n-x)[logq+log(n/(n-x)]

x = uσ + μ = u√npq + np により,

x/n=p+u√(pq/n)
(n-x)/n=q-u√(pq/n)

となり、n-->大の時

x/n -->p
(n-x)/n--->q

となるので、これを代入して整理すると

log(σ・二項分布)≒-(1/2)log(2Π)-x(log(1/p+log(x/n)]-(n-x)[log(1/q)+log((n-x)/n)]
               =-(1/2)log(2Π)-xlog(1+u√(q/np))-(n-x)log(1-u√(q/np)

テイラー展開 log(1 + x) = x −x^2/2+o(x^3)を用いて、整理すれば

log(σ・二項分布)≒-((1/2)log 2π −(1/2)u^2(p + q)+O(1/√n)

以上より  

σ・二項分布-->1/√2π・exp(-u^2)

となり、正規分布にN[0,1]に漸近することがわかる。


トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-06-06 (日) 15:44:00 (3473d)