ChunPom’s diary

数学、物理、機械学習に関する話題。あと院試、資格、大学入試まで。

色々な確率分布まとめ2-連続型-

統計学でよく用いられる確率分布の一覧を示す。今回は、連続値の確率変数に対する確率分布を紹介する。

 

連続型確率分布

1 連続一様分布

 確率変数 {\displaystyle X}{\displaystyle a,b\ (a\lt b)} の間の値を等確率でとるとする。この時の確率密度関数は、

\begin{eqnarray*} f(x;a,b)=\frac{\partial}{\partial x}P(X\leq x)=\left\{ \begin{array}( (b-a)^{-1}\ \ &(a\leq x\leq b)&\\0\ \  &(otherwise)& \end{array} \right. \end{eqnarray*} 

と表され、連続一様分布といい、{\displaystyle U(a,b)} で表す。

平均は {\displaystyle (a+b)/2} 、分散は {\displaystyle (b-a)^2/12}。 

母関数は

{\displaystyle M(t;a,b)=E[e^{tx}]=t\frac{e^b-e^a}{b-a}.}

 

2 正規分布(ガウス分布)

 平均 {\displaystyle \mu} と分散 {\displaystyle \sigma^2} を持つガウス分布確率密度関数は、

{\displaystyle f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi \sigma^2}}exp \left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} }

と表され、{\displaystyle N(\mu,\sigma^2)} で表す。特に {\displaystyle N(0,1)} を標準正規分布という。例えば {\displaystyle X}~{\displaystyle N(\mu,\sigma^2)} の時、標準化された {\displaystyle \frac{X-\mu}{\sigma}} は {\displaystyle N(0,1)} に従う。

母関数は

{\displaystyle M(t;\mu, \sigma^2)=exp\left(\mu t+\frac{1}{2}\sigma^2 t^2\right)}

 と表せ、分布の再生性を持つ。

 

3 指数分布

 {\displaystyle \lambda\gt 0} を用いて、

{\displaystyle f(x;\lambda)=\lambda e^{-\lambda x} \ \ (x\geq 0)}

と表される確率密度関数に従う分布を、指数分布という。これを特に {\displaystyle Exp(\lambda)} と表す。

平均は {\displaystyle 1/\lambda} 、分散は {\displaystyle 1/\lambda^2}

母関数は

{\displaystyle M(t;\lambda)=\left(\frac{\lambda}{\lambda-t}\right).}

 

4 ガンマ分布

 {\displaystyle \alpha,\beta\gt 0} を用いて、

{\displaystyle f(x;\alpha,\beta)=\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} \ \ (x\geq 0)}

と表される確率密度関数に従う分布を、ガンマ分布という。これを特に {\displaystyle Ga(\alpha,\beta)} と表す。ただし、ガンマ関数は

{\displaystyle \Gamma(\alpha)=\int_{0}^{\infty}t^{\alpha-1}e^{-t}dt}

平均は {\displaystyle \frac{\alpha}{\beta}} 、分散は {\displaystyle \frac{\alpha}{\beta^2}}

母関数は

{\displaystyle M(t;\alpha,\beta)=\left(\frac{\beta}{\beta-t}\right)^{\alpha}}

となり、指数分布のそれの  {\displaystyle \alpha} 乗であることがわかる。すなわち、分布の再生性を持つ。

 

5 ベータ分布

 {\displaystyle 0}~{\displaystyle 1} の値をとる確率変数に対し、 {\displaystyle \alpha,\beta\gt 0} を用いて、

{\displaystyle f(x;\alpha,\beta)=\frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1} \ \ (0 \leq x\leq 1)}

と表される確率密度関数に従う分布を、ベータ分布という。これを特に {\displaystyle Be(\alpha,\beta)} と表す。

ここでベータ関数は以下のように表せる。

{\displaystyle B(\alpha,\beta)\equiv \int_0^1 x^{\alpha-1}(1-x)^{\beta-1}dx=\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}}

ベータ分布の平均は {\displaystyle \frac{\alpha}{\alpha+\beta}} 、分散は {\displaystyle \frac{\alpha \beta}{(\alpha+\beta)^2(\alpha+\beta+1)}}

母関数は

{\displaystyle M(t;\alpha,\beta)=1+\sum _{k=1}^{\infty }\left(\prod _{r=0}^{k-1}{\frac {\alpha +r}{\alpha +\beta +r}}\right){\frac {t^{k}}{k!}}.}

 

6 コーシー分布

{\displaystyle f(x)=\frac{1}{\pi} \frac{1}{x^2+1}\ \ (-\infty \leq x\leq \infty)}

で表される確率密度関数に従う分布を、コーシー分布という。

平均や分散は、広義積分の値は存在せず、定義できない。

同様に母関数も定義できない。ただし、分布の再生性は持つ(特性関数が指数関数になるため)。

この分布は、正規分布などに比べると裾が重く(flat)、外れ値がでる確率が高い特徴を持つ。

 

7 ロジスティック分布

{\displaystyle f(x)=\frac{e^{-x}}{\{1+e^{-x}\}^2} \ \ (-\infty \leq x\leq \infty)}

で表される確率密度関数に従う分布を、ロジスティック分布という。

平均は0、分散は {\displaystyle \pi^2/3}

母関数は 

{\displaystyle M(t)= \Gamma(1+t)\Gamma(1-t).}

 

8 対数正規分布

 {\displaystyle Y}~{\displaystyle N(\mu,\sigma^2)} の時、{\displaystyle X=exp(Y)} が満たす確率分布は、

{\displaystyle f(x)=\frac{1}{\sqrt{2\pi \sigma^2}x}exp\left\{-\frac{(\ln(x)-\mu)^2}{2\sigma^2}\right\}\ \ (x\geq0)}

で表され、対数正規分布という。

平均は{\displaystyle e^{\mu+\sigma^2/2}}、分散は {\displaystyle e^{2\mu+\sigma^2}\{e^{\sigma^2}-1\}}

母関数は、簡潔な表現ができないため割愛する。

 

 

各確率分布の詳細については、以下の教科書を参照されたい。

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 
確率統計演習 1 確率

確率統計演習 1 確率