1. 主な基本統計量(平均、中央値、最頻値)

統計

 今回は、主な基本統計量(平均、中央値、最頻値)についての記事です。
その他多くのサイトでは、個別に詳しく書いてあるのでこのブログでは簡単にイメージしやすくサクッと読める形で解説できたらと思います。
 以下の表1を用いて、例題を交えて解説していきます。

国語 社会 数学 理科 英語 理系科目 文系科目 5教科合計
Aさん 87 71 72 77 66 149 224 373
Bさん 78 74 85 90 88 175 240 415
Cさん 68 78 67 70 75 137 221 358
Dさん 60 78 80 74 75 154 213 367
Eさん 49 56 94 68 66 162 171 333
表1. 5教科得点

平 均(相加平均)

平均とはあるデータの「合計した値」をその「データの数」で割ったもの。

ゆらのす
ゆらのす

母親から3人の兄弟へのお小遣いが(1,000円、2,000円、3,000円)だった時に、父親が一旦回収して平等に2,000円分配する感じかな(笑)
データのでっこみ、引っ込みをなくして平らに均すってイメージがいいと思う!

あと、相加平均は算術平均とも呼ぶみたいだね!

例1)表1の国語の平均を求める。

国語
Aさん87
Bさん78
Cさん68
Dさん60
Eさん49
 1.抜粋

Step1 : データの合計を求める(点数の合計を算出する。)
 合計 = 87 + 78 + 68 + 60 + 49
   = 342点

Step2 : データの個数の算出(何人いるかを算出する。)
 人数 = Aさん + Bさん + Cさん + Dさん + Eさん
    = 5人

Step3 : 平均を求める(「合計」を「人数」で割る。)
 平均 = 「合計」 ÷ 「人数」
    = 342 ÷ 5
    = 68.4点

中央値

中央値とはあるデータを順番(昇順もしくは降順)に並べたときにちょうど真ん中に位置する値の事。

ゆらのす
ゆらのす

データの個数が、奇数の場合と偶数の場合で求め方が異なるから注意してね!

例1)表1の数学の中央値を求める。(データの個数が奇数の場合)

数学
Eさん94
Bさん85
Dさん80
Aさん72
Cさん67
   表2.1

Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
 表1を表2.1 の様、降順(または昇順)に並び替える。

Step2 : データの個数を数える。
 Aさん~Eさんまでは5人いるためデータの個数は、5個

Step3 : 中央値を求める。 
 データの数が奇数の場合、データを順番に並たときに
 ちょうど真ん中に来る値が中央値となる。
 よって中央値は、80点




例2)表2.2の数学の中央値を求める。(データの個数が偶数の場合)

体育
Eさん94
Bさん85
Dさん80
Aさん72
Cさん67
Fさん64
   表2.2

Step1 : データの整列(Aさん~Fさんまでの点数並び替える。)
 表1を表2.2の様、降順(または昇順)に並び替える。

Step2 : データの個数を数える。
 Aさん~Fさんまでは6人いるためデータの個数は、6個

Step3 : 中央値を求める。 
 データの数が偶数の場合、データを順番に並たときに
 真ん中に来る2つの値の平均(足して2で割ったもの)したもの
 が中央値となる。よって中央値は、
 中央値 =(80 + 72)÷ 2 = 152 ÷ 2 = 76点




ゆらのす
ゆらのす

中央値は、データを順番(昇順もしくは降順)に並べたときにちょうど真ん中に来る値だから偶数の場合はデータの真ん中の値が2つあるから、ちょうど真ん中の値は表面上隠れているだけとイメージすると定義に沿うように覚えられそうだね!

最頻値

最頻値とはあるデータの集まりにおいて、もっとも個数の多いデータの事。

ゆらのす
ゆらのす

最頻値は、繁に表れるってことだね!

例1)表1の社会の最頻値を求める。(最頻値が1つだけの場合)

社会
Cさん78
Dさん78
Bさん74
Aさん71
Cさん56
   3.1

Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
 表1を表3.1 の様、降順(または昇順)に並び替える。

Step2 : データの中に同じ値があるか確認する。
 Aさん~Eさんまでの点数を見比べると78が2つある。

Step3 : 最頻値を求める。 
 この時の最頻値については、78点




例2)表1の英語の最頻値を求める。(最頻値が複数あるの場合)

英語
Bさん88
Cさん75
Dさん75
Aさん66
Eさん66
   3.2

Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
     表1を表3.2 の様、降順(または昇順)に並び替える。

Step2 : データの中に同じ値があるか確認する。
     Aさん~Eさんまでの点数を見比べると75と66が2つずつある。

Step3 : 最頻値を求める。 
     この時の最頻値については、75点, 66点




例3)表1の数学の最頻値を求める。(最頻値が無い(もしくはすべてが最頻値)の場合)

数学
Eさん94
Bさん85
Dさん80
Aさん72
Cさん67
   表3.3

Step1 : データの整列(Aさん~Eさんまでの点数並び替える。)
 表1を表3.3 の様、降順(または昇順)に並び替える。

Step2 : データの中に同じ値があるか確認する。
 Aさん~Eさんまでの点数を見比べると同じ値はない。

Step3 : 最頻値を求める。 
 この時の最頻値については、定義の仕方によって異なる。
 最頻値無しとする場合もあれば、全て(94, 85, 80, 72, 67)
 を最頻値とする場合もある。




まとめ

  • 平 均:あるデータの「合計した値」をその「データの数」で割ったもの。
  • 中央値:あるデータを順番(昇順もしくは降順)に並べたときにちょうど真ん中に位置する値の事。
  • 最頻値:あるデータの集まりにおいて、もっとも個数の多いデータの事。
ゆらのす
ゆらのす

平均には、相加平均(算術平均)、相乗平均(幾何平均)、調和平均とかもあるけど、今回はそんなものもあるんだくらいに思ってもらえたらいいよ!

 今回は中央値、最頻値について解説してみました。
 次回は最大値、最小値、レンジについて解説したいと思います。
 ご拝読ありがとうございました。

コメント

タイトルとURLをコピーしました