統計

(平成21年6月6日)

 統計は確率を決めるためにあります。確率は自分の心の抱く量ですから推定するのでなく決めるものです。統計を取る目的は確率を、推定するためではなく、決めるために行うものです。何の確率かはそれぞれも問題によります。

 何らかの一群の一つの側面を観察したときに大体同じような値であることが判るときがあります。しかし、必ずしも同じような値である必要はありません。このような一群を母集団と呼びます。

 例えば、日本人の身長に着目すればそれは一つの母集団です。日本人の身長は全員が同じ値なのではなく、大体のところ1m以上で2m以下ぐらいの範囲に収まっています。1m60cm前後の人が最も多いでしょう。このような散らばり方の全体を母集団の分布と呼びます。

 統計を取る目的は母集団の分布を確定するためであると言っても良いでしょう。母集団を構成する要素全部の数値を知ることができれば分布は確定します。

 母集団を構成する要素が少ない場合は分布を確定できるが、構成要素が多い場合は確定することは時間的にも、経済的にも、出来ない場合が多いのです。

 このような場合でも、標本を取って母集団を推定することができます。統計理論に従い、標本を上手く選べば、標本数は母集団の数から比べてかなり小さくても良い推定ができます。標本を上手く選ぶとは、論理的に偏りが無いようにすることです。俗に、ランダムに選ぶとも言います。

 一般的に言って、標本数は大きいほど推定精度は高くできます。ただ、無暗に多くしても効果が得られない場合があることに注意しなければなりません。この場合は、標本数を多くしても論理的に偏りが無いと言えなくなる場合です。有名なパラドックスに「中国の皇帝の身長」があります。

戻る