分布図

(平成21年6月6日)

 母集団の要素が全部判っているものと想定します。例として、着目している要素は日本人の身長であるとしましょう。するとデータは日本人一人一人の身長のを0.1cm単位で測った数値の集合ということになります。これが母集団です。

 このデータを1cm単位で区分し、それぞれの区分に何人該当するかを調べます。注意すべきは区分を等間隔にすることです。また、一つの数値が両方の区分に入らないようにしなければなりません。例えば、区分の分け方は、1cmを区分の間隔にするなら、164cm以上165cm未満を一つの区分にする。163.5cm以上164.5cm未満としても構わないませんが、以上と以下の組み合わせでは、一つの数値が両方に入ってしまい2度カウントされる恐れがあります。

 横軸に身長、縦軸に各区分に入った人数を取って出来る棒グラフが分布図です。全数調査は大変ですから、無作為にあつめた標本で代行させます。標本数は全数にくらべたら、驚くほど少なくて良いのです。これが統計学を学ぶ利点の一つです。標本で分布を作る場合は、標本のデータ個数が少ないので注意が必要です。個数に応じて区分間隔を決める必要があります。一つの区間に入るデータ数を頻度と呼んで、頻度図ということもあります。

 データは身長に限らず、常に実数であり、有限の桁数で表示されている離散値です。分布図を描くときに横軸の座標の取り方によって、同じ母集団の分布図でも形状が異なってきます。

 身長の分布図では165cm前後をピークとする釣鐘状の形になるでしょう。母集団を体質量(体重)にして統計を取れば、日本人の場合は60Kg前後をピークに同じように釣鐘状の分布図が得られるでしょう。

 3次元座標で横軸に身長、縦軸に体質量、高さ軸に頻度をとると2次元の分布図が出来ます。このときの区分は身長が1cm、体質量が1Kgとして、例えば身長150cm以上151cm未満で体質量40Kg以上41Kg以下を一つの区分とします。

 2次元以上の分布図を考える必要性は少ないので、まず1次元の分布図で説明を続けます。

戻る