●現在の計算処理技術がもたらした、人工知能技術の進展
昔から人工知能の分野には、「モラべックのパラドックス」という問題が知られています。これは、子どもができることほど、コンピュータにやらせるのは難しい、ということです。
実は、人工知能の研究が始まってから比較的早い1960~70年代に、定理を証明する人工知能であるとか、チェスを打つ、あるいは医療の診断をするような人工知能などは、次々に実現しています。ところが、画像を認識したり積み木を上手に積むといった、子どもでもできるようなことは、一向にできるようにならない。何十年たってもできるようにならない。ということで、これは非常に逆説的である。簡単に思えることほど人工知能にとっては難しいということで、パラドックスだと言われてきたわけです。
それが、ここ3年ぐらいの間に急速に変わりつつあります。画像認識では人間の精度を上回るぐらいになりましたし、運動の習熟もできるようになってきました。結局そこで何がポイントだったかというと、世の中の森羅万象から、「どういう情報が重要なのか」という、特徴量を取り出すところ、情報を抜き出すところが、実は一番計算量が多く、最も大変だったのです。
これは、現在ディープラーニングで画像認識する場合にも、最新のGPUのサーバーを使って、これを何台も並列に並べて、何十時間、あるいは時には何千時間も計算し続けて、それによって、ようやく人間と近いところまで学習が進むわけです。つまり、現在のコンピュータの計算量をもって、ようやく可能になってきているということです。
●「特徴量の抽出」は、赤ちゃんの時にやっている
人間の場合、おそらくこういった特徴量の抽出という作業は、赤ちゃんの時にやっているのではないかと思っています。0~1歳の時に、ただ泣いて寝ているだけかというと、そんなことはなく、非常に重要な学習をしているはずです。おそらくは、先ほどのオートエンコーダのような仕組みによって、自分が次に何を見るのか、何を聞くのかを予測しながら、その予測に寄与するような特徴量を取り出していっている。それを下から次々と積み上げている。こういうことだと思います。
2歳ぐらいになると、言葉を覚え始めます。お母さんが「猫だ」というと、それが猫であることが分かるようになります。赤ちゃんがそれを猫だと覚えられるからには、すでに赤ちゃんの中に「猫」という概念ができているはずなのですね。すでに概念ができているから、それ(「猫」の概念)に対してお母さんが「猫」というラベルを当てはめてあげると、覚えることができる。そのため、いったん言葉を覚え始めると、子どもはすごい勢いで言葉を覚えていくわけです。それができるのは、もうあらかたの概念が出来上がっているので、あとはラベルを教えればよいだけだからです。0~1歳児、あるいは2歳児といった、非常に若い頃の何年間かを使って、いま言ったような処理をやっているのではないかと思います。
●「人間の知能をコンピュータ上で実現する」という野望
実はディープラーニングの考え方自体は昔からありまして、いろいろな研究者がトライしてきました。古くは1980年に、当時NHKの放送技術研究所におられた福島邦彦先生という方が、「ネオコグニトロン」という名前で提案されています。今のディープラーニングの仕組みは、この福島先生が言われていたこととほぼ同じなのですが、やはり当時の計算機のパワーだとなかなかできませんでした。それが、今の計算機のパワーをもって初めて、ようやく可能になってきたということだと思います。
人工知能という分野は、もともと人間の知能をコンピュータで実現したいという、非常に野心的な試みからスタートした分野です。なぜそのように考えたかというと、人間の脳は、ある種の電気回路のように思えるからです。ということは、人間の脳がやっていることは、情報処理のようにも思えます。そうだとすると、全ての情報処理はコンピュータで実現できるはずです。アラン・チューリングという人が、「万能チューリングマシン」という概念を使って言ったことです。人間の脳がやっていることが、何らかの情報処理なのだとすれば、コンピュータでできない理由を見つける方がすごく難しいのです。
そうやって普通に考えると、人間の脳の働きをコンピュータで実現できるのではないかと思うわけですが、そう思って60年間研究してきても、やはり一向にできない。それがなぜか。私は、問題は次の点にしかないと思っています。要するに「認識」ができなかったからである。世の中の情報の中から、何が重要なのかを見抜く。そこに一番計算量が多くかかり、最も大変だったからだと思っています。
現在ではそれが解消されつつあるわけで...