●ディープラーニングで0.1秒後が予測できるようになった
松尾です。ディープラーニングの産業論についてお話ししたいと思います。
すでに何度もお話ししているのですが、ディープラーニング技術によって、画像認識の性能が急速に伸びています。2015年には人間の精度を超えるところまで来ています。それに伴って、学習がどんどん深くなっており、最近では100層を超えるネットワークがつくられるようになってきました。
単に画像認識の精度が上がるだけでなく、面白いことも次々にできるようになっています。例えば、われわれは車に乗っているとき、次にどうなるかを予測しながら外を見ています。ですから、予測と違うことが起こるとビックリするわけです。人間や生物にとって、このように次の瞬間を予測する能力は非常に重要なもので、いわば私たちは予測しながら生きているのです。実は最近、ディープラーニングによって0.1秒後にどういったものが見えるかが予測できるようになりました。上が実際の画像で、下が予測した画像です。お分かりの通り上下がほとんど同じ画像になっていて、車が左に動いていくこともその通りに予測できています。
それから、人間は画像を1枚見ると、次に何が起こりそうかを予測することができます。例えば、ビーチの写真を見ると、波はザバーンと来ることが分かります。なぜなら、ビーチの映像を何度も見たことがあるからです。それと同じように、静止画を与えると、次の1秒間の動画を生成する技術がつくられました。ビーチなら波が寄せてきますし、ゴルフ場なら人が前に向かって歩いたり、ボールを打ったりする動画が自動的につくられるのです。
さらに、人間の場合、じっと見て予測しているだけでなく、自分が何かをしたときに起こることも予測しています。それと同じように、ロボットが手を動かすと、それに伴って「こうやってものが動く」ということも予測できるようになっています。
【参考動画1】
The latest news from Research at Google: Large-scale data collection with an array of robots
https://youtu.be/iaF43Ze1oeI
●機械やロボットの「眼」が誕生した
今お話ししたような技術が次々と出てきているわけですが、私は、こうした現象は一言で言えば「眼の誕生」だと思っています。まさに『眼の誕生――カンブリア紀大進化の謎を解く』(アンドリュー・パーカー著、 渡辺政隆翻訳, 今西康子翻訳、草思社)という本があるのですが、これはカンブリア爆発について書かれている本です。カンブリア爆発とは5億4200万年前から5億3000万年前という比較的短期間に、現存するほぼ全ての生物種が出そろったことを指します。なぜ短期間で生物多様性が高まったのかについては諸説があるのですが、10年くらい前にアンドリュー・パーカーは『眼の誕生』の中で、それは高度な眼を持った三葉虫が現れたからだという「光スイッチ説」を唱えました。それまでの生物は高度な眼を持っていなかったので、ぶつかると食べたり逃げたりするといった動きしかできなかったのですが、高度な眼があると捕食の可能性が一気に上がるので、生存上、大変有利になるのです。逃げる方も、眼を持つと、見つかったから逃げよう、隠れよう、擬態しようといったさまざまな戦略を持てるようになります。つまり、眼ができたことで生物の戦略が多様化し、それによって生物種が多様化したことがパーカーの光スイッチ説なのです。
ディープラーニングは画像認識、つまり眼の技術ですから、今後、機械やロボットの世界でカンブリア爆発が起こることが予想できます。これまでの機械やロボットは眼を持っていませんでしたから、見えなくてもいい作業しかできませんでした。ところが今後、機械やロボットは眼を持つので、見る必要のある作業ができるようになるのです。
「眼」というと、すでにカメラがあるではないかと思う方もいるでしょう。しかし、カメラやイメージセンサーは人間でいえば網膜にすぎません。人間の場合、網膜と脳の後ろの方にある視覚野の両方が働くことで初めて見えるのです。この視覚野に当たるのがディープラーニング技術です。カメラとディープラーニングが組み合わさって、初めて「眼が見える」というわけです。
●農業も建設も食品加工も究極的には全工程が自動化される
眼が見えると、機械やロボットはどのようなことができるのでしょうか。私の予想では、農業や建設業や食品加工業向けの機械・ロボットが次々に生まれると思っています。考えてみれば、人類の工業化の歴史は...