●経済学はパラメータをあらかじめ限定して理論を構築してきた
柳川 前回松尾先生が言われた点は、先ほどの経済学の分析でも、かなり重要です。「理論」として前回申しあげた話は、説明変数のパラメータをある程度、理論で最初から絞ったものです。これは自然科学でも、おそらくそうだったのだと思います。
ある種の行動を説明したり規定したりする理由には、いくつかの可能性があります。例えば、我々が今日コーヒーを飲んだとします。その際、なぜコーヒーを飲んだのかについては、いろいろな可能性があります。例えば、喉が渇いていたか、その人が本質的に紅茶よりコーヒーが好きかどうかなどが、コーヒーを飲むことに大きく影響されるだろうと推測(guess)されます。そこで、これらをパラメータ化することで、コーヒーを飲むか飲まないかという現象が説明されるかどうかということを、その候補のパラメータについて調べます。
しかし、影響する無限の可能性を全部入れると、とても計算やデータの分析はできません。砂漠のなかで宝石を探すに近いようなことにもなりかねません。そこである種、現実的な対応として、「こういうものが重要だろう」という候補を挙げて、そのパラメータに関してだけ、データを分析し、結果との相関を見るということをやってきました。
●AIによってデータから理論を構築することが可能になるかも
柳川 松尾さんが言ったような多数パラメータの話は、最初からある種の推測を追ってパラメータの候補を見てしまうと、場合によってはすごく大きな不十分性をもたらしてしまうということです。ディープラーニングでは、あまり制約をせずに、全てのパラメータを見ることによって、重要なパラメータを見つけ出すことができます。これは、より正確に相関関係を見つけ出すことにもつながります。
さらに、結果から2つのパラメータに相関があるのかを虚心坦懐に見ることで、新しい理論をつくることができるかもしれません。もともとは、理論から実証、あるいは理論からデータを見るという流れだったのが、データからAIを通して理論を組み立てていくという流れになるということが、今、起きつつあるのかなと思います。
●表現力の高いモデルを理解するのは難しい
松尾 そうですね。例えば、がんの発症を分析するのに、いろいろなデータを使います。最近明らかになったのは、入れる特...