多数パラメータ系の学習において重要になるのは発想の転換 - 柳川範之 | 教養動画メディア『テンミニッツ・アカデミー』

経済学がパラメータ（変数）をあらかじめ絞ってモデルを構築し、データに当てはめるのに対し、ディープラーニングは、データからたくさんのパラメータによるモデル構築を可能にする。それにより、現象の表現力は高まるが、それを人間が理解するには困難が生じる。（全8話中第2話）
※司会者：川上達史（テンミニッツTV編集長）

時間：10分57秒
収録日：2020年3月3日
追加日：2020年4月28日

カテゴリー：

≪全文≫

●経済学はパラメータをあらかじめ限定して理論を構築してきた

柳川　前回松尾先生が言われた点は、先ほどの経済学の分析でも、かなり重要です。「理論」として前回申しあげた話は、説明変数のパラメータをある程度、理論で最初から絞ったものです。これは自然科学でも、おそらくそうだったのだと思います。

　ある種の行動を説明したり規定したりする理由には、いくつかの可能性があります。例えば、我々が今日コーヒーを飲んだとします。その際、なぜコーヒーを飲んだのかについては、いろいろな可能性があります。例えば、喉が渇いていたか、その人が本質的に紅茶よりコーヒーが好きかどうかなどが、コーヒーを飲むことに大きく影響されるだろうと推測（guess）されます。そこで、これらをパラメータ化することで、コーヒーを飲むか飲まないかという現象が説明されるかどうかということを、その候補のパラメータについて調べます。

　しかし、影響する無限の可能性を全部入れると、とても計算やデータの分析はできません。砂漠のなかで宝石を探すに近いようなことにもなりかねません。そこである種、現実的な対応として、「こういうものが重要だろう」という候補を挙げて、そのパラメータに関してだけ、データを分析し、結果との相関を見るということをやってきました。

●AIによってデータから理論を構築することが可能になるかも

柳川　松尾さんが言ったような多数パラメータの話は、最初からある種の推測を追ってパラメータの候補を見てしまうと、場合によってはすごく大きな不十分性をもたらしてしまうということです。ディープラーニングでは、あまり制約をせずに、全てのパラメータを見ることによって、重要なパラメータを見つけ出すことができます。これは、より正確に相関関係を見つけ出すことにもつながります。

　さらに、結果から2つのパラメータに相関があるのかを虚心坦懐に見ることで、新しい理論をつくることができるかもしれません。もともとは、理論から実証、あるいは理論からデータを見るという流れだったのが、データからAIを通して理論を組み立てていくという流れになるということが、今、起きつつあるのかなと思います。