●分かりやすい着順と分かりにくい判定
それでは、「評価」という話をいたします。日常的に接している「評価」にはいくつかの事例があるので、まず具体的な話から始めたいと思います。
例えば、オリンピックを見ていると、陸上競技や水泳の場合は非常に分かりやすい。時間でも見ることができるし、タッチやゴールを越えた瞬間を見てもいいので、1着は誰が見ても1着です。一方、体操やフィギュアスケートでは、審査が加わってきます。柔道やレスリングも「一本勝ち」だと簡単ですが、「判定」的なことが入ると、「なんでこれは?」と首をひねるように、体操などの判定にも分かりにくいところがたくさん出てくるわけです。
では「評価」と「着順」を決めることの関係はどうなっているのか、その疑問が一つ目です。
二つ目は、よく大学の入試で「一点刻みの点数で合否を決めるのは良くない。もっと幅を持たせろ」と言う人がいます。特に政治家に多いのですが、「尺度」というものがまったく分かっていません。なぜ分かっていないのかということを、後ほど申し上げます。
それから選挙の場、あるいはマーケットでは、「売れたか」「ベストセラーはどれか」という話があります。しかし、ベストセラーの車とベストの車は、実は一緒ではありません。ベストセラーからノーベル賞まで、「審査」と「売れる」、つまり数が多いことは、実は同じではないということです。
これら三つのことをお話ししますが、実はこれらは関連しているわけです。
●審査は多次元尺度、勝敗は1点刻み
100メートル走で誰が1位かの着順を決めるのは、尺度を一次元的にしているから決めやすいわけです。(一次元的な尺度とは)「速さ」や「高さ」や「重さ」などです。重量挙げでたくさん重いものを上げたら、それは勝つ。さらに誰が勝者かは、バスケットボールであろうとサッカーであろうと、1点差で決まる(碁の場合は「半目勝ち」がありますが)わけです。
ところが、「審査」では通常、多次元尺度か合成尺度が用いられます。「技術点」や「芸術点」があって、それらを足し合わせます。さらに、チェックする項目は何項目にもわたります。こういうことが、体操などでも出てくるわけです。
そうなると、入試のときの1点刻みは当然出てくる話です。百点満点にしても千点満点にしても、合否の境目は「1点」です。この「1点」のところに複数の人間が集まるということは、しばしば起こります。
これを例えば「ABCDの幅にしろ」という人がいます。これは、百点を4段階尺度にするというだけの話で、AとBやBとCの間は1点刻みになります。「尺度をつくる」ということの意味が分かっていない人は、政治家の中にも、実は残念ながら学者の中にもいるということになります。
百点をABCDの4段階に置き直すのは簡単なことで、転換する方程式をつくるだけでいいわけです。ところが、ABCDを百点満点に換算できるかというと、百点満点にするとAだった人が全部100点なり80点なりというところに集中してしまうわけです。
●「ABCD」と「合否」は、2分割か4分割かの違い
これが、実は「尺度」の持つ問題なのです。われわれが細かく点を付けておいて集約をするとき、「ABCD」にするか「合格と不合格」にするか、つまり4段階にするか2段階にするか、ということであるわけです。
では、尺度を増やしていくと、能力を判定していくことはできるのか。例えば3教科で評価しているのを5教科、あるいは7教科にするなど教科科目を増やすと能力を多面的に測れるのかというと、多分そうではないでしょう。これは、ある能力、例えば記憶力を複数で測っただけであって、記憶力の点数が加算されるだけということになります。
また尺度の中で、「感動」を尺度にすることはできるのかというと、これはできるのですが、そのつくり方はなかなか難しい。例えば、音楽や美術、あるいは体育系やスポーツ系など、「実技」のある入学試験があります。これらは実際にやってみないと分かりません。楽理などは紙で試験をしても分かるかもしれませんが、その人の音楽能力、例えばどれだけの声が出るか、どれだけピアノが弾けるかは分かりません。ですから、実技という尺度もあるということです。
●尺度項目をどう決め、どう得点化するかが悩み
このように、多次元の尺度の中で一番分かりやすい一次元にしているのが、誰が一番速いかの「着順」なわけです。そういう意味では、投票で誰が一番になるかは着順を決めていることと同じで、票数によって決まるのはベストセラーと同じ原理です。
本来であれば1位になる人は、十分その人の能力を多次元的に有権者が判断して1位にしているはずなのですが、ただ知名度だけで反応し...