平均点は偏差値50。そこまではよく知られているが、あとは経験則でよいか悪いかを判断する人が多い。ここではその偏差値について説明してみる。
受験者の点数から、平均点と標準偏差を求めることができる。平均点を m 点、標準偏差を s とする。table.vrTable {border-collapse:collapse;border-spacing:0;width: auto; margin: 0 auto;} .vrTable th, .vrTable td { padding: .5em .5em; border: 1px solid #aaf;}
標準偏差
まず標準偏差について感覚的な説明をしておく。標準偏差とは、平均的なばらつきのことである。そう、一般的に、どの程度平均値から離れているのかを表している。上の記号を使えば、だいたい s 点 平均から離れているものだ、ということができる(あくまで指標)。
平均との差を評価したいのなら、(1/n)Σ(Xn - m) や (1/n)Σ|Xn - m| を使えばいいと思うかもしれないが、前者は m(平均) と同じ値になるし、後者は微積分の計算が大変になる。そこで、標準偏差を使っている。
偏差値の計算式
では具体的に偏差値の計算式を説明していく。君の点数を X 点 としよう。すると、平均との差は X - m となる。
X = m + (X - m)
このずれ X - m が、標準的なずれ(標準偏差) s の何倍かを求め、それに 10 をかけたのが偏差値50 からのずれとなる。つまり
{(X - m) / s} × 10
が 偏差値 50 からのずれなので、X 点 のときの偏差値は、
f(X) = 50 + {(X - m) / s} × 10
となる。(これを一次変換というが、実数の世界にいる限りたいしたことはないので説明は省く。)
さて、偏差値がわかったところでこの偏差値についてもう少し探ってみよう。
よいテスト - 正規分布
学校で、「よいテスト」というのは、ちょうど50点が平均となり、50点を頂点として山の形に点数が分布するテストらしい(現役教員が言っていた)。0点や100点に近づくほど人が少なくなる。
統計でよく使われるのが Normal Distribution (正規分布) というやつで、ガウス分布とも言う。これが上に書いたような山の形をしている。
では、よいテスト(点数分布が正規分布に従っているテスト)で、偏差値80とはどういうことか。80だと、標準偏差の3倍のずれがあることになる。正規分布表で調べると、偏差値80以上の人は、上位0.13% ということになる。
偏差値60以上上位15%
偏差値70以上上位2%
ただしこれは、テストの点数分布が正規分布に従った場合の話。しかしそれでも偏差値から割合を計算することはできる。チェビシェフの不等式というのがある。
チェビシェフの不等式
P(|X - m| ≧ ks) ≦ 1/k2 [k > 0, s > 0]
これがチェビシェフの不等式。早速検証してみよう。左辺は、平均値からのずれが ks よりも大きくなる確率。
P(|x - m| ≧ ks) = (1/n) Σ|x - m| ≧ ks1
左辺の確率は、 m からのずれが ks よりも大きくなる人数を、全員の人数で割ればよい。上の、Σ|x - m| ≧ ks1 は、|x - m| ≧ ks となる x について、1 を足すということで、条件を満たす場合だけ 1 が足される。これにより、条件を満たす点数をとった人数が求められる。
今は、|x - m| ≧ ks となる場合についての話なので、
|x - m|/(ks) ≧ 1 [s > 0 のとき]。
これより
{|x - m|/(ks)}2 ≧ 1 。
よって、
(1/n) Σ|x - m| ≧ ks1
≦ (1/n) Σ|x - m| ≧ ks{|x - m|/(ks)}2
= (1/n) Σすべての x{|x - m|/(ks)}2
≦ {1/(ks)2} (1/n)Σすべての x|x - m|2
= {1/(ks)2} s2
= 1/k2 。
証明修了。等合が成立する例は、k=1, m=0, {xn}={-1, 1}(-1 と 1 のデータが同じ数だけある) という場合。等号成立条件は、すべての x について |x - m| = ks となる場合。
式変形がトリッキーだから、この不等式が発見された時は、もっと違うやり方で見つけたんじゃないかと思う。s2 = (1/n)Σ(x - m)2 ≧ (1/n) Σ|x - m| ≧ ks|x - m|2 = (1/n) Σ|x - m| ≧ ks|x - m|2 ≧ (1/n) Σ|x - m| ≧ ks(ks)2 = k2s2 (1/n)Σ|x - m| ≧ ks1 = k2s2 P(|x - m| ≧ ks) とするのが自然に見える。
この、チェビシェフの不等式によると、
偏差値40以下と60以上100%以下
偏差値30以下と70以上25%以下
偏差値20以下と80以上11%以下
ということになる。これは、どんな分布になっていても成り立つ。