箱ひげ図という統計グラフの描き方の手順

箱ひげ図の描き方の手順

学習する学年:高校生

1.箱ひげ図の説明

箱ひげ図とは、データの範囲とばらつきを箱や箱から伸びるひげで表す統計グラフのことです。

データの種類は、ものの種類・区別を表した質的データと数量を表した量的データがありますが、箱ひげ図はどちかといえば量的データを扱うことに適しています。

箱ひげ図は最小値~最大値までのデータを25%ごとに4等分してデータが集中している箇所を調べるのに適した特徴を持ったグラフなので、箱ひげ図を使う目的はデータの範囲と集団の標準的な傾向を調べる為です。

箱ひげ図を描く手順ですが、

  1. 散らばっているデータをまとめる
  2. まとめたデータを表にする
  3. 表の数値を元にしてドットプロットを描く
  4. ドットプロットから箱ひげ図を描く

の4工程の順番です。

箱ひげ図を描くことができたらそれで終わりではなく、描いた箱ひげ図をじっくり見てグラフからどのような傾向が読み取れるのか考えます。

統計グラフの勉強をして散らばっているデータをまとめてグラフを描き、そして描いたグラフを読み取れる力が身に着くと物事を比較検討する力も同時に身に着きます。

中学生・高校生・大学生・社会人の方で統計グラフの描き方がよくわからないという方は、箱ひげ図から勉強するのではなく、統計グラフの基本である絵グラフから描いて見てください。

以下に箱ひげ図の描き方を例題を使ってわかりやすく説明していますので描き方を読んでイメージをつかんでください。

スポンサーリンク

2.マンガを読む冊数で箱ひげ図の描き方の例題

マンガの冊数の調査

しゅうへい君はマンガが好きなので勉強をせずに毎日マンガばかり読んでいたらお母さんにマンガを没収されてしまいました。そこで、自分はマンガを読む冊数が多いのか少ないのか知りたくなったので、1週間に何冊のマンガを読んでいるのかクラスの25人から聞き取り調査をしました。上の図はその時に作ったマンガを読む冊数のメモです。

こういう場合を例にして、どのように箱ひげ図にすればいいのか1つ1つ考えてみましょう。

箱ひげ図を描く手順は覚えていますか?

1番目は散らばっているデータをまとめる、2番目はまとめたデータを表にする、3番目は表の数値を元にしてドットプロットを描く、4番目はドットプロットから箱ひげ図を描くという順番で行ってください。

手順1.
まずは、上の図の人数をグループごとに分けて整理しましょう。

統計グラフを描く時はデータを整理することはとても重要な作業です。散らかっているデータは目的に応じて整理することで意味を持つデータに変わり、データの整理の良し悪しで統計グラフの質に大きく関係してきますので、面倒くさがらずにしっかり整理してください。

この場合のグループは冊数が適していますよね。

したがって、それぞれの冊数ごとのグループにして人数を整理すれば綺麗にまとまりそうです。上の図は、0冊、1冊、2冊・・・8冊、9冊に分けて人数のデータをまとめてみると次のようになります。

  • 0冊:1人
  • 1冊:1人
  • 2冊:3人
  • 3冊:7人
  • 4冊:6人
  • 5冊:4人
  • 6冊:2人
  • 7冊:0人
  • 8冊:0人
  • 9冊:1人

これでマンガを読む冊数ごとに分けた人数の整理ができました。

手順2.
次は、まとめたデータを表にしてみましょう。

表を作る時は項目が必要です。この場合は、マンガを読む冊数ごとの人数を調べましたので、冊数、人数を項目として表を作るのが適切ですよね。

表を作ると次のようになります。

まとめたデータから表を作る

データの整理がしっかりできていれば、表を作ることは難しくないですよね。

手順3.
次は、表の数値を元にしてドットプロットを描きます。

ドットプロットとは、1つのデータを1つのドットとして横軸の値の上にドットを積み上げて表す統計図のことです。

ですので、ドットプロットは横軸が必要となります。この場合は、表の項目の冊数を横軸に使えば大丈夫ですよね。

横軸は一番左を0冊として右に行くほど値が大きくなるように目盛りを書きこみます。

横軸の項目と目盛りを書きこみましたら、表から読み取った値をドットとして横軸の値の上に積み上げてグラフに描いてください。
※ドットの色は何色でも構いません。

ドットプロットを作ると次のようになります。

表からドットプロットを作る

なお、箱ひげ図はドットプロットを描かなくても作れますが、ドットプロットを描くと箱ひげ図が描きやすくなるので慣れないうちは描いてください。

手順4.
最後は、ドットプロットを元にして箱ひげ図を描きます。

箱ひげ図を描く時は、最小値、第1四分位数(だいいちしぶんいすう)、中央値、第3四分位数(だいさんしぶんいすう)、最大値という5つの値が必要となります。

  • 最小値:一番小さい値のこと
  • 第1四分位数:全体の中央値よりも小さい値の集団の中の中央値のこと
  • 中央値:大きさ順に並べたデータの個数の真ん中の値のこと
  • 第3四分位数:全体の中央値よりも大きい値の集団の中の中央値のこと
  • 最大値:一番大きい値のこと

まずは、最小値と最大値を探しましょう。一番小さいデータと一番大きいデータを探せばいいので、最小値は一番左の値の0冊、最大値は一番右の値の9冊ですよね。最小値と最大値はドットプロットを見ればすぐにわかります。

次は、中央値を計算しましょう。全体のデータの個数は25個あるので、(25+1)=13となり、中央値は左から右へ向かって数えて13番目のデータとなります。したがって4冊です。

第1四分位数は全体の中央値よりも小さい集団の個数で計算するので12個ですよね。(12+1)÷2=6.5となり、第1四分位数は左から右へ向かって数えて6.5番目のデータとなります。したがって3冊です。

第3四分位数は全体の中央値よりも大きい集団の個数で計算するので12個ですよね。(12+1)÷2=6.5となり、第3四分位数は右から左へ向かって数えて6.5番目のデータとなります。左から右へ向かって数えれば19.5番目です。したがって5冊です。

上記で求めた最小値(0冊)、第1四分位数(3冊)、中央値(4冊)、第3四分位数(5冊)、最大値(9冊)の箇所で線を縦に伸ばして最小値と最大値を線で結び箱ひげ図を描くと、下の図のように箱からひげが伸びた図形が描けます。このグラフが箱ひげ図です。

ドットプロットから箱ひげ図を作る

箱ひげ図を描くことによって、最小値から第1四分位数までは25%、第1四分位数から中央値までは25%、中央値から第3四分位数までは25%、第3四分位数から最大値までは25%というように4等分に分けることができるのでデータの傾向がつかみやすくなります。

なお、データを小さい順に左から並べた時の最小値、第1四分位数、中央値、第3四分位数、最大値の関係は次の通りです。それぞれの区間は25%ずつに分かれていますよね。

最小値、第1四分位数、中央値、第3四分位数、最大値

上の箱ひげ図とドットプロット図からいらないものを削除して箱ひげ図だけにすると下の図になります。

箱ひげ図

これで箱ひげ図は完成してすべてのデータの整理が終わりました。

箱ひげ図が完成した後は、箱ひげ図からデータの傾向や特徴を考えてみましょう。

まずは、1週間でマンガを読む冊数の最大値と最小値を比べて見ると、

  • 最大の冊数は9冊
  • 最小の冊数は0冊

ということがわかります。

最大値と最小値がわかると範囲(レンジ)が求められます。範囲とは、最大値と最小値の差のことで、この場合は、9-0=9が範囲となります。

範囲が小さいとデータのばらつき方は小さい、範囲が大きいとデータのばらつき方は大きいというように、範囲はデータが全体的にどのようにばらついているのかの目安となります。

統計グラフから最大値と最小値を探し出して比べるだけならば棒グラフでもできますよね。

箱ひげ図のいいところは、箱の大きさを見ればデータ全体の個数はどの辺りに集中しているのかすぐにわかることなので、次はデータが集中している区間を調べてみましょう。

データが集中している区間は標準的な値としての目安となります。50%のデータが集まっている第1四分位数から第3四分位数までの間の冊数を上のグラフを見ると3~5冊ですよね。したがって、3~5冊が標準的な冊数といえます。また、中央値である4冊はデータの個数の真ん中なので一番標準的であることがわかります。

以上の結果をまとめると、上のグラフから言えることは、マンガを全く読まない人や9冊読む人もいますが、マンガを読む冊数は3~5冊の人が多い傾向があるということです。

このように、箱ひげ図はデータの最小値と最大値の範囲とデータが集中している区間を調べる時に使うことに適している統計グラフです。

トップページへ戻る |  学年別一覧へ行く 

スポンサーリンク
トップページへ戻る
学年別一覧へ行く
スポンサーリンク


スポンサーリンク
スポンサーリンク
スポンサーリンク