二項分布とは

ある集団において,特性 A を持つものの割合が p であり,持たないものの割合が q であるとする( p + q = 1 )。このとき,集団から無作為に n 人を抽出したとき,特性 A を持つものが x 人である確率。 n 人のうち x 人が特性を持つ組合せは nCx 通りある x 人が特性 A を持つ確率は p^x,残り n - x 人が特性を持たない確率は q^(n - x )であり,両者が共に起こるのは両者の積である。

f ( x ) = nCx p^x q^(n - x),  x = 0,1, … ,n,p > 0,q > 0,p + q = 1
nCx=n!/[x!・(n-x)!]

二項分布の平均と分散

二項分布の平均 E ( x ) と分散 V ( x ) は

E ( x ) = n p, V ( x ) = n p q

である。

  • 平均の証明
    μ=E ( x ) =Σxf(x)
    を求めるために,次の2項展開を考える
    (q+pt)^n=ΣnCk q^(n-k) p^kt^k
    両辺をtで微分する。
    np(q+pt)^(n-1)=ΣnCk q^(n-k) p^k・k ・t^(k-1)   (1)式
    t=1と置くと、上式はq+p=1より
    np=ΣnCk k q^(n-k) p^k=Σxf(x)=μ
    (証明 終わり)
  • 分散の証明
    V=E ((x-μ)^2)=Σ(xーμ)^2・f(x)=E(x^2)-μ^2
    を求める。 (1)式を、再度微分する。
    n・(n-1)・p^2(q+pt)^(n-2)=ΣnCk q^(n-k) p^k・k ・(k-1)t^(k-2)
    これにt=1を代入し、q+p=1より
    n・(n-1)・p^2=ΣnCk q^(n-k) p^k・k ・(k-1)=E(k^2)-E(k)
    書き換えてE(k)=μ=npより
    E(k^2)=n・(n-1)・p^2 - np
    最初の分散の式に代入して
    V==E(x^2)-μ^2=n・(n-1)・p^2 - np-(np)^2
     = n^2p^2-np^2+np-n^2p^2
     = np(1-p)=npq
    (証明終わり)

ベルヌーイ試行

1 回ごとの事象の生起確率 p が一定であるとき,実験を独立に繰り返し行うことを ベルヌーイ試行 という。

2項分布は、成功の確率 p のベルヌーイ試行を n 回行った時の成功の回数 x である。

  • B(n, p) = f ( x ) = nCx p^x q^(n - x)

単独の x に関する確率を求めるよりも、ある区間に関する確率を求めることの方が多い。例えば、成功が a 回以下である確率、Pr{ x ≦ a } は

ΣB(a, p) ただし Σはa=0~nの和
  • これを累積2項分布という
    Sum binominal.JPG

2項展開と2項分布

二項展開から、

[p + (1-p)]^ n = nC0 p^0(1-p)^n + nC1 p^1(1-p)^(n-1)+ … + nCn p^n(1-p)^0 =1

これは、n回ベルにーイ試行を行った場合の成功の回数が、0,1,2,・・・,nである確率を合計したもであり、当然、すべての成功する場合を尽くしているので、1に一致している。

ベルヌーイ試行と大数の法則

ヤコブ・ベルヌーイ(Jacques Bernoulli 1654-1705)は確率論の基礎になる大数の法則を見つけた

硬貨を投げる際、投げる回数を多くすれば表と裏が出る確率は1/2に集中してくる、それより大きくなったり小さくなったりすることは無い。 またサイコロを投げた場合、回数が多くなればある目の出る確率は1/6である。このような現象は確率の本質的な性格で大数の法則と呼ばれる。 ベルヌーイはスイスの数学者で、名著「推測法」で新奇さ、素晴らしい実用性、極端な難解さを兼ね備えたベルヌーイの定理、一般的には「大数の法則」と呼ばれるものを発表して確率論の基礎を造った。 ベルヌーイ試行(Bernoulli Trials)とは白か黒か・表か裏か・成功か失敗か等、どちらかの事象が独立して起る確率を公式化したものである。

成功の可能性を(p)、失敗の可能性を(1-p)とする。n回の成功とm回の失敗の出る確率はつぎの公式で表わせる。

Prob(n成功、またはm失敗)=(n+m)!/n!×m!×p^n(1-p)^m

ポアソン分布

n が大きく p が小さい場合、np は適度な大きさとなるため、パラメータ λ = np であるポアソン分布が B(n, p) の良好な近似となる。

  • λ = np が一定の場合、n を大きく(かつ p を小さく)しても分布には僅かな変化しか生じない. すなわち、平均値が一定のベルヌーイ試行を、多数繰り返した場合の極限分布がポアソン分布になる。
  • ポアソン分布は、平均も分散もλである。

正規分布

np および n(1 − p) が5よりも大きい場合、B(n, p)に対する良好な近似として正規分布がある これは、E ( x ) = n p, V ( x ) = n p q の正規分布で近似できる。

N(np,np(1 − p))
  • 正規分布への近似は、アブラーム・ド・モアブルが1733年に著書 The Doctrine of Chances の中で紹介したのが最初である。今日では、互いに独立で同一の分布に従う n 個の確率変数の和の分布は B(n, p) になることが、中心極限定理によって確認されている。
    binominal distribution.JPG

多項分布

多項分布(たこうぶんぷ、英: Multinomial distribution)は、確率論において二項分布を一般化した確率分布である。

二項分布は、n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率は同じである。多項分布では、各試行の結果は固定の有限個(k個)の値をとり、それぞれの値をとる確率は p1, ..., pk(すなわち、i = 1, ..., k について pi ≥ 0 であり、Σpi=1 が成り立つ)であり、n 回の独立した試行が行われる。確率変数 Xi は n回の試行で i という数が出る回数を示す。ベクトルX=(x1,x2,・・・,xn) は n と p をパラメータとする多項分布に従う。

multinominaldistribution.JPG
  • k=2 の多項分布を二項分布と呼ぶ。
  • 期待値: E(xi)=npi
  • 分散 : V(xi)=npiqi=npi(1-pi)
  • 共分散: Cov(xi,Xj)=-npipj

添付ファイル: fileSum binominal.JPG 513件 [詳細] filebinominal distribution.JPG 551件 [詳細] filemultinominaldistribution.JPG 500件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-09-14 (水) 16:23:00 (2503d)