月別アーカイブ: 2020年1月

平均にだまされるな (2)

1万人分のデータがたったひとつの数字になりました。
平均60歳。いい感じです。

次にその中身を見てみます。
と言っても、1万人分の年齢データをひとつひとつ見るわけではありません。
図にします。
その時に役に立つのがパソコン。具体的にはエクセルです。
面倒なことはエクセルにお任せしましょう。

「どんな図にするのですか?」という質問があると思います。
百聞は一見にしかず。まずは見て下さい。


この図は、年齢を5歳きざみに区分して、その区分ごとの総数を表示したものです。
エクセル2016以上であれば、簡単に作成できます。
こんな図をみるのは初めてという人はいないのではないでしょうか。

棒グラフがくっついているように見えますが、棒グラフではありません。
ちゃんと名前がついています。
統計業界ではこの図のことを、「ヒストグラム」と言います。

グラフなので、「ヒストグラ」と覚えてしまいそうですが、
グラですので、お間違えないように。
英語のhistogramをそのままカタカナにしただけです。

ということで、今回はデータの中身を直観的に感じる道具として、
ヒストグラムを紹介しました。
統計を勉強していて、ヒストグラムというグラフを知らないのは
ちょっと異常な感じがしますので、覚えておいて下さい。

新しい用語が出たところで、第2回目は終了とします。
どうです。難しいことはないですよね。




平均にだまされるな (1)

 

平均。統計業界の業界用語で、最も有名な言葉です。
この言葉を聞いて、アレルギーが発生する人はいないと思います。
それくらい有名で、みんなが親しんでいる言葉です。
しかしながら、その解釈には注意が必要です。

まずは平均のいいところ。
例えば、2019年1月から12月に病院に来院した患者さんの年齢データ。
医療関係の人にセミナーをすることが多いので、医療系の話になってしまいますが、
そこはご了承ください。

2019年1年間で1万人が来院。
ということは、1万人分の年齢があります。
1万人ですよ。すべての数字を見たところで、普通の人間には理解不能。
そこで、人間が理解できる程度の数まで落とします。
1万人のデータをひとつの数字で表現できれば、それはそれはうれしいはずです。

ひとつの数字。つまり要約です。
ついに、平均の出番です。
1万人だろうが、10万人だろうが、平均すれば「ひとつの数字」になります。

2019年の外来患者さんの平均年齢は60歳です。
これって、ものすごくわかりやすいですし、なんか統計ぽい感じがしますよね。
平均のいいところ。どんなに多いデータでも、「ひとつの数字」にできる。
平均のなせるわざです。(脱帽!!)

ここまでは納得してもらえますか。