●ディープラーニングの登場は「カンブリア爆発」に匹敵する
ここまでお話ししたことを一言で言えば、「目」の誕生だと思っています。ディープラーニングとは、「目」の技術で、画像認識の精度が非常に上がっているということです。
画面には「カンブリア爆発」と書いています。これは何かというと、現在、地球ができて45億年ほどたちますが、その中で見ると5億4,200万年前から5億3,000万年前という非常に短い期間に、生物の多様性がいきなり上がったことです。現存する、ほぼ全ての生物の「門」が出てきたという時期でした。
なぜそのような短期間に生物の多様性が上がったのかは長年の謎でした。諸説ある中で、アンドリュー・パーカーという人が10年ほど前に唱えたのが、「光スイッチ説」です。すなわち、多様性が急上昇したのは生物が目を持ったからだということです。それまでの生物は、高度な目を持っていなかったので、「ぶつかると食べる」とか「ぶつかられると逃げる」といった、とてもモソッとした動きしかできなかったのです。しかし、目を持つと、遠くから見えるようになるため、捕食の確率が非常に上がります。
そうすると、見つかった方も目を持ちます。見つかったから早く逃げよう、隠れよう、擬態しようといった、いろいろな戦略が出てきました。目を持ったために、生物の多様性が大きく広がり、戦略もとても多様になりました。その結果、生物が非常に多種になったのです。
パーカー氏が出したのはそういう説ですが、私はそれと同じことが、今後、機械・ロボットの世界でも起こると思います。機械・ロボットの世界で、これから「カンブリア爆発」が起こるということです。今までの機械やロボットは、要するに「目」がなかったのです。目が見えていなかったので、目が見えなくても可能な動作しかできませんでした。それが今後「目」を持つことになれば、機械自身が状況を上手に見ながら判断して動作することができるようになります。
「目」といっても、すでにカメラがついているではないかと思われると思います。しかしカメラ、すなわちイメージセンサーは、人間で言えば網膜です。人間の場合、網膜で受け取ったシーンを、その後ろの視覚野で処理することによって「見える」ことになります。ディープラーニングとは、(網膜ではなく)視覚野の部分です。つまり、イメージセンサーとディープラーニングの両方が合わさって、初めて機械が「見える」ようになるということです。
●単純作業からプラットフォームへ
そうすると、どういうところに影響があるか。私が典型例として挙げているのは、農業、建設、食品加工の分野です。こういった自然物を扱っている領域を自動化するのは、今まで非常に難しかったのです。なぜなら、(自然物そのものを)見ないといけないからです。自然物は一つ一つの状態が違うので、それをいちいち見ないといけません。それが自動化できるということです。
例えば、トマト収穫ロボットというものは、ありませんでした。トマトは市場規模が大きいですし、収穫には非常にコストがかかります。それにもかかわらず、トマト収穫ロボットはありませんでした。その理由は非常に単純で、トマトがどこになっているのか、ロボットに見えてなかったからです。
ところが今では、画像認識の精度が人間を超えていますから、どこにトマトがあるのかロボットにも見えるようになりました。またトマトのもぎ取りも、運動の習熟・学習をさせれば、上手にもぎ取れるようになります。だからトマト収穫ロボットがつくれるはずなのです。
次に建設現場です。例えば、溶接という作業は大変な仕事で、通常、職人が行います。これもなぜ機械化できなかったかといえば、溶接面の状態を見ながら作業しないといけないからです。それもできるようになります。
さらに食品加工です。調理全般がそうですが、一番やりやすいところでいえば、食洗器にお皿を入れる作業です。もちろん食洗器に入れてしまえば自動で洗えるのですが、食洗器に入れる作業は人間がやっています。飲食店によっては、その作業がたまってしまっては困るのです。しかし、お皿を食洗器に入れる機械はつくれるはずです。こういう作業は、機械に「目」があればすぐにできるでしょう。
こういう機械をつくった後、次に何ができるようになるか。例えば、トマト収穫ロボットは、トマトが収穫できるだけではなく、そのうちトマトが病気なのかどうかといった判定もできるようになります。そうすると、病気かどうかの判定に対して、チャージするというサービス課金ができるようになってきます。
同じように建設用の溶接ロボットも、溶接をするだけではなく、すでに終わった溶接のチェックをするといった新たな付加価値を出して、そこに対してチャージ...