ベイズ推定の理論の基礎1
ベイズ推定を用いて、データ (n個の測定データ) から、 の従う確率分布を求めることを考える。
真の分布を とし、用いる確率モデルを としよう。ここで はモデルのパラメータである。ベイズ理論により、 に対する事後分布は以下のように書ける。
ここで は事前分布であり、 は規格化のために導入された分配関数である。
さて、最適な を求めたいわけだが、どのように決めてやれば良いのか。損失関数を定義しその最小値を与えるもの、と決めることができそうだが、得てしてその値が過学習に陥ってしまったり、解が複数存在してどれを選択すべきかわからない!といった場合もある。
そこで、 を適切に評価するには、以下の諸関数の導入が必要となる。ここでは、定義だけ述べて、具体的な計算は後日行うことにする。
自由エネルギーは
汎化損失は
経験損失は
平均対数損失関数は
経験対数損失関数は
以下、平均対数損失関数を最小にするパラメータの一つを とする。
対数尤度比関数は
平均誤差関数は
経験誤差関数は
これらの誤差関数は、定義から明らかに
を満足する。
また、経験誤差関数を用いると、上述の事後分布は
と表すことができる。ここで新たな規格化定数を使用した。
真の分布 が判明している時のベイズ推定の基本的なフローは、
① 事前分布と確率モデルを決める
② 平均対数損失関数を最小にするパラメータ を求める
③ 経験誤差関数を求める
④ 分配関数を求め、事後分布を得る
⑤ 自由エネルギー、汎化損失、経験損失を求める
である。
ただし、真の分布がわからない時には、②や④の計算は困難になるだろう。その場合には、経験対数損失関数の最小を求めるなどの近似が必要となってくる。