ベイズの定理

(平成21年9月14日)

 積の規則を書き換えると、
 P(A|BC)=P(A|C)・P(B|AC)/P(B|C)
この式はベイズの定理に他ならないものでした。

ベイズの定理

ここで次のようにX、H、Dの記号に次の意味を持たせます。
 X:事前情報
 H:検定されるべきある仮説
 D:データ

積の規則からベイズの定理の誘導をもう一度繰り返します。
 P(DH|X)=P(D|HX)P(H|X)=P(H|DX)P(D|X)
故に、 P(H|DX)=P(H|X)P(D|HX)/P(D|X)

 P(H|X)はデータを見る前の命題Hの確かさで、P(H|DX) はデータを見た後の命題Hの確かさです。
 
 P(D|HX)は仮説Hに対するデータDの尤度と呼ばれるものです。
 P(D/X)は正規化定数の役割を担うものです。正規化定数は確率全部を積分すると1になるようにするものです。

 つまり、ベイズの定理は、データを見た後の確率がデータを見る前の確率にデータの尤度を乗じたものに比例することを表しています。その比例定数が1/P(D/X)だということです。

 データを見る前と後というのは、事象の発生に対する時間とは関係なく、データを知ったか、知る前であったかです。

 データを見ることによって確かさがどのように変わるかを計算する式でもあるので、ベイズの定理は重要な位置づけにあります。

 ベイズ流統計学ではこの式を中心に据えて、情報の入手により事後確率を求めるものです。ただ、事前確率を仮定するものとしている場合があって、これが混乱の元になっていると思われます。

 事前確率も入手済みの全ての情報から合理的に割り当てるのが正しい方法です。ただ、中途半端な情報で合理的な事前確率の割り当てが難しい場合も多いことは確かです。この場合、「仮定する」と言ってしまう場合が多いのです。

戻る