ChunPom’s diary

数学、物理、機械学習に関する話題。あと院試、資格、大学入試まで。

色々な確率分布まとめ1-離散型-

統計学でよく用いられる確率分布の一覧を示す。今回は、離散値の確率変数に対する確率分布を紹介する。

 

離散型確率分布

1 離散一様分布

 確率変数 {\displaystyle X}自然数 {\displaystyle 1,2,...,n} の値を等確率でとるとする。この時の確率関数は、

{\displaystyle P(X=x)=\frac{1}{n}\ \ (x=1,...,n)}

と表され、離散一様分布という。

平均は {\displaystyle (n+1)/2} 、分散は {\displaystyle (n^2-1)/12}。 

母関数は

{\displaystyle G(s;n)=E[s^x]=\frac{s(1-s^n)}{n(1-s)}.}

 

2 ベルヌーイ分布

 確率変数 {\displaystyle X}{\displaystyle \{0,1\}} の2値を、それぞれ {\displaystyle 1-p,p} の確率で起こるとする。この時の確率関数は、

{\displaystyle P(X=x)=p^x(1-p)^{(1-x)}\ \ (x=0,1)}

と表され、ベルヌーイ分布という。また、このような2値が決まった確率で出現する試行をベルヌーイ試行と呼ぶ。

平均は {\displaystyle p} 、分散は {\displaystyle p(1-p)}

母関数は

{\displaystyle G(s;p)=E[s^x]=ps+1-p.}

 

3 二項分布

 確率変数 {\displaystyle Y_i \ (i=1,...,n)} が独立に同一の上記のベルヌーイ分布に従っている場合に、確率変数の和 {\displaystyle X=\sum_{i=1}^{n}Y_i} の従う確率関数は、

{\displaystyle P(X=x)={}_n C _xp^x(1-p)^{(n-x)}\ \ (x=0,...,n)}

と表され、二項分布という。これを特に {\displaystyle B(n,p)} と表す。

平均は {\displaystyle np} 、分散は {\displaystyle np(1-p)}

母関数は

{\displaystyle G(s;n,p)=E[s^x]=(ps+1-p)^n}

となり、ベルヌーイ分布のそれの {\displaystyle n} 乗になっていることがわかる。 すなわち、分布の再生性を有する。

 

4 幾何分布

 無限に続くベルヌーイ試行において、{\displaystyle X} 回目で初めて1が出現する際の {\displaystyle X} の確率関数は

{\displaystyle P(X=x)=p(1-p)^x\ \ (x=0,1,...)}

と表され、幾何分布という。

平均は {\displaystyle (1-p)/p} 、分散は {\displaystyle (1-p)/p^2}

母関数は

{\displaystyle G(s;p)=E[s^x]=\frac{p}{1-(1-p)s}.}

幾何分布は、無記憶性を持つ。

 

5 負の二項分布

 無限に続くベルヌーイ試行において、{\displaystyle X} 回目で初めて、1が {\displaystyle r} 回出現する際の {\displaystyle X} の確率関数は

{\displaystyle P(X=x)={}_{x+r-1} C _x p^r (1-p)^x\ \ (x=0,1,...)}

と表され、負の二項分布といい、 {\displaystyle NB(r,p)} と表す。

平均は {\displaystyle r(1-p)/p} 、分散は {\displaystyle r(1-p)/p^2}

母関数は

{\displaystyle G(s;p)=E[s^x]=\left\{\frac{p}{1-(1-p)s}\right\}^r}

となり、幾何分布のそれの {\displaystyle r} 乗になっていることがわかる。すなわち、分布の再生性を有する。 

 

6 ポアソン分布

 二項分布 {\displaystyle B(n,p)} において、期待値 {\displaystyle np} を一定値 {\displaystyle \lambda} に保ったまま  {\displaystyle n\to \infty} として得られる確率分布であり、確率関数は 

{\displaystyle P(X=x)=exp(-\lambda)\frac{\lambda^x}{x!}\ \ (x=0,1,...).}

と表され、ポアソン分布といい、 {\displaystyle Po(\lambda)} と表す。

平均と分散はともに {\displaystyle \lambda} となり等しい。

母関数は

{\displaystyle G(s;\lambda)=E[s^x]=exp(-\lambda (1-s))}

となり、分布の再生性を有する。

ポアソン分布は、ある離散的な事象に対して、決まった時間内で平均的に {\displaystyle \lambda} 回起こる事象の生起回数の確率を示している。

 

7 超幾何分布

 壺の中に白玉が {\displaystyle M} 個、 黒玉が {\displaystyle N-M} 個入っているとし、{\displaystyle n} 個を非復元抽出で取り出す。この際、取り出された白玉の個数 {\displaystyle X} の確率関数は、

{\displaystyle P(X=x)=\frac{{}_M \hat{C} _x \cdot{}_{N-M} \hat{C} _{n-x}}{{}_N C _n}\ \ (x=0,...,n)}

と表され、超幾何分布という。ここで、{\displaystyle {}_A \hat{C} _B} は、通常の組み合わせを、{\displaystyle A \lt B} の際に0となるように拡張したものである。 

平均は {\displaystyle nM/N} 、分散は {\displaystyle n\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1}.}

{\displaystyle M/N} を一定値 {\displaystyle p} に保ったまま  {\displaystyle N\to \infty} とすれば、二項定理が得られる。

 

 

各確率分布の詳細については、以下の教科書を参照されたい。

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 
確率統計演習 1 確率

確率統計演習 1 確率