●再々来した人工知能の「ブーム」
東京大学の松尾と言います。人工知能について話していきたいと思います。
今、人工知能というキーワードがすごく注目されています。人工知能という分野は、1956年に始まったと言われていますので、今年(2016年)でちょうど60年になります。この60年の間に、かなり激しい波がありました。ブームになっては冬の時代が来て、またブームになっては冬の時代が来て、という波を繰り返している分野です。今回またブームになってきているわけで、これは3回目のブームです。
1回目のブームでは、「推論」や「探索」が中心になって、それが1950~60年代でした。2回目のブームは、「知識処理」「エキスパートシステム」というのが中心になり、日本では第五世代コンピュータ・プロジェクトという計画も行われましたが、それが1980年代でした。今、第3次のAIブームが来ていますが、そこではビッグデータ、それからコンピュータの処理能力増大を背景にして、「機械学習」あるいは「ディープラーニング」が注目されています。
●「ディープラーニング」は、従来の技術とは別格である
キーワードとしてはたくさん出ています。例えばワトソン、Siri、Pepper、将棋の電王戦、自動運転、こういったものが人工知能に関するキーワードとしてよく挙げられます。実は歴史的に見ると、昔から研究されている技術が少しずつ良くなって今に至っている、と捉えるのがいいかと思っています。昔はできなかったことが、今になって急にできるようになっているわけではなく、少しずつ良くなっているということです。
例えば将棋の電王戦で、プロ棋士に勝つような人工知能ができてきていますが、実はボードゲームについては、チェスでチャンピオンに勝ったのが1997年ですから、もう20年近く前からある話なのですね。さらにオセロはもっと前に勝っています。つまり、オセロよりチェスの方が難しくて、チェスより将棋の方が難しい。そして将棋より囲碁の方が難しい。だから人工知能が勝つのに時間がかかる。「難しい」というのは、その解空間が大きいという意味です。その難しい方向に向かって、技術がどんどん進化しているということです。そのためブームになっても、急に今までできなかったことができるようになるわけではありません。ですので、期待が過剰にならないように注意しないといけないとは思います。
ところが、今回扱う「ディープラーニング」に関してだけは、私は少し別格のものだと思っています。ディープラーニングでは、今までできなかったことが急速にできるようになってきています。
●従来の「機械学習」の問題は、「特徴量の設計」にあった
そこで、ディープラーニングの話に行く前に、通常の「機械学習」はどのように進められるかを説明したいと思います。例えば、機械学習でプロ棋士に勝つような人工知能をどうやってつくるかというと、通常は過去の膨大な棋譜データを使います。プロ棋士が「こういう状況でこういう手を指しました」という「状況」と、指し手である「手」をセットにして、コンピュータに覚えさせていくという作業を行います。
この「状況」を記述するのに、変数というものを使います。ある状況を変数で表すということをやるわけです。将棋の場合駒の数が40個なので、40個の変数で表すというのが最も単純なやり方です。現在、プロ棋士に勝つような人工知能というのは、この変数の数が数百万個以上もあります。なぜかというと、「王」と「金」と「銀」の相対的な位置関係や、「王」と「銀」と「角」の相対的な位置関係などを全て変数にしていくと、組み合わせとして非常に数が多くなり、数百万個以上になるからです。こうすると、すごく強くなります。
ところが、「このように変数を使うと良い」ということに気づいたのは、人工知能ではなく研究者です。ある研究者が数年前に、「三つの駒の相対的な関係性を使うと良い」ということに気づいたので、人工知能が強くなったわけですね。ですから機械学習といっても、コンピュータが学習しているように見えて、実は人間が変数を設定しないといけなかったわけです。
実はそこが非常に重要で、良い変数を設定できれば精度は上がるし、そうでないと精度は上がらないということがありました。これが現在の機械学習では、特徴量の設計、すなわちフィーチャー・エンジニアリングと言われるもので、すごく難しい問題でした。結局は、人間がやるしかなかったからです。
それ以外にも、60年間に及ぶ人工知能の研究の中で、難しいとされている問題がたくさんあります。例えばフレーム問題、あるいはシンボル・グラウンディング問題が、その代表的なものです。