今回は、主な基本統計量(平均、中央値、最頻値)についての記事です。
その他多くのサイトでは、個別に詳しく書いてあるのでこのブログでは簡単にイメージしやすくサクッと読める形で解説できたらと思います。
以下の表1を用いて、例題を交えて解説していきます。
国語 | 社会 | 数学 | 理科 | 英語 | 理系科目 | 文系科目 | 5教科合計 | |
Aさん | 87 | 71 | 72 | 77 | 66 | 149 | 224 | 373 |
Bさん | 78 | 74 | 85 | 90 | 88 | 175 | 240 | 415 |
Cさん | 68 | 78 | 67 | 70 | 75 | 137 | 221 | 358 |
Dさん | 60 | 78 | 80 | 74 | 75 | 154 | 213 | 367 |
Eさん | 49 | 56 | 94 | 68 | 66 | 162 | 171 | 333 |
平 均(相加平均)
平均とはあるデータの「合計した値」をその「データの数」で割ったもの。
母親から3人の兄弟へのお小遣いが(1,000円、2,000円、3,000円)だった時に、父親が一旦回収して平等に2,000円分配する感じかな(笑)
データのでっこみ、引っ込みをなくして平らに均すってイメージがいいと思う!
あと、相加平均は算術平均とも呼ぶみたいだね!
例1)表1の国語の平均を求める。
国語 | |
Aさん | 87 |
Bさん | 78 |
Cさん | 68 |
Dさん | 60 |
Eさん | 49 |
Step1 : データの合計を求める(点数の合計を算出する。)
合計 = 87 + 78 + 68 + 60 + 49
= 342点
Step2 : データの個数の算出(何人いるかを算出する。)
人数 = Aさん + Bさん + Cさん + Dさん + Eさん
= 5人
Step3 : 平均を求める(「合計」を「人数」で割る。)
平均 = 「合計」 ÷ 「人数」
= 342 ÷ 5
= 68.4点
中央値
中央値とはあるデータを順番(昇順もしくは降順)に並べたときにちょうど真ん中に位置する値の事。
データの個数が、奇数の場合と偶数の場合で求め方が異なるから注意してね!
例1)表1の数学の中央値を求める。(データの個数が奇数の場合)
数学 | |
Eさん | 94 |
Bさん | 85 |
Dさん | 80 |
Aさん | 72 |
Cさん | 67 |
Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
表1を表2.1 の様、降順(または昇順)に並び替える。
Step2 : データの個数を数える。
Aさん~Eさんまでは5人いるためデータの個数は、5個
Step3 : 中央値を求める。
データの数が奇数の場合、データを順番に並たときに
ちょうど真ん中に来る値が中央値となる。
よって中央値は、80点
例2)表2.2の数学の中央値を求める。(データの個数が偶数の場合)
体育 | |
Eさん | 94 |
Bさん | 85 |
Dさん | 80 |
Aさん | 72 |
Cさん | 67 |
Fさん | 64 |
Step1 : データの整列(Aさん~Fさんまでの点数並び替える。)
表1を表2.2の様、降順(または昇順)に並び替える。
Step2 : データの個数を数える。
Aさん~Fさんまでは6人いるためデータの個数は、6個
Step3 : 中央値を求める。
データの数が偶数の場合、データを順番に並たときに
真ん中に来る2つの値の平均(足して2で割ったもの)したもの
が中央値となる。よって中央値は、
中央値 =(80 + 72)÷ 2 = 152 ÷ 2 = 76点
中央値は、データを順番(昇順もしくは降順)に並べたときにちょうど真ん中に来る値だから偶数の場合はデータの真ん中の値が2つあるから、ちょうど真ん中の値は表面上隠れているだけとイメージすると定義に沿うように覚えられそうだね!
最頻値
最頻値とはあるデータの集まりにおいて、もっとも個数の多いデータの事。
最頻値は、最も頻繁に表れる値ってことだね!
例1)表1の社会の最頻値を求める。(最頻値が1つだけの場合)
社会 | |
Cさん | 78 |
Dさん | 78 |
Bさん | 74 |
Aさん | 71 |
Cさん | 56 |
Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
表1を表3.1 の様、降順(または昇順)に並び替える。
Step2 : データの中に同じ値があるか確認する。
Aさん~Eさんまでの点数を見比べると78が2つある。
Step3 : 最頻値を求める。
この時の最頻値については、78点
例2)表1の英語の最頻値を求める。(最頻値が複数あるの場合)
英語 | |
Bさん | 88 |
Cさん | 75 |
Dさん | 75 |
Aさん | 66 |
Eさん | 66 |
Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
表1を表3.2 の様、降順(または昇順)に並び替える。
Step2 : データの中に同じ値があるか確認する。
Aさん~Eさんまでの点数を見比べると75と66が2つずつある。
Step3 : 最頻値を求める。
この時の最頻値については、75点, 66点
例3)表1の数学の最頻値を求める。(最頻値が無い(もしくはすべてが最頻値)の場合)
数学 | |
Eさん | 94 |
Bさん | 85 |
Dさん | 80 |
Aさん | 72 |
Cさん | 67 |
Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
表1を表3.3 の様、降順(または昇順)に並び替える。
Step2 : データの中に同じ値があるか確認する。
Aさん~Eさんまでの点数を見比べると同じ値はない。
Step3 : 最頻値を求める。
この時の最頻値については、定義の仕方によって異なる。
最頻値無しとする場合もあれば、全て(94, 85, 80, 72, 67)
を最頻値とする場合もある。
まとめ
- 平 均:あるデータの「合計した値」をその「データの数」で割ったもの。
- 中央値:あるデータを順番(昇順もしくは降順)に並べたときにちょうど真ん中に位置する値の事。
- 最頻値:あるデータの集まりにおいて、もっとも個数の多いデータの事。
平均には、相加平均(算術平均)、相乗平均(幾何平均)、調和平均とかもあるけど、今回はそんなものもあるんだくらいに思ってもらえたらいいよ!
今回は中央値、最頻値について解説してみました。
次回は最大値、最小値、レンジについて解説したいと思います。
ご拝読ありがとうございました。
コメント