ディープラーニングを取り巻く3つの動きに注目 - 松尾豊 | 教養動画メディア『テンミニッツ・アカデミー』

2019年ディープラーニングの最新事情

この講義の続きはもちろん、

5,000本以上の動画を好きなだけ見られる。

スキマ時間に“一流の教養”が身につく

まずは72時間￥0で体験

ディープラーニングを取り巻く3つの動きに注目

2019年ディープラーニングの最新事情

科学と技術

松尾豊（東京大学大学院工学系研究科人工物工学研究センター／技術経営戦略学専攻長教授）

1.ディープラーニングを取り巻く3つの動きに注目

10分20秒

近年、画像認識の精度が非常に上がっているディープラーニングだが、現状はどうなっているのか。「世界モデル」「AutoML」「多数パラメータの科学」といったキーワードを挙げて、ディープラーニングの最新の動向について解説する。

時間：10分20秒
収録日：2019年8月28日
追加日：2019年10月3日

カテゴリー：

≪全文≫

●AIの「世界モデル」－低次元構造の把握で空間認識

　東京大学の松尾豊です。今日はディープラーニングの最新の動向について、お話ししたいと思います。

　3つトピックがありますが、1つ目は「世界モデル」というものです。これはどういうものか、説明いたします。

　ディープラーニングによって画像認識の精度は非常に良くなってきました。一方で、われわれ人間は何か物を見たとき、それが何かと認識するだけではなく、例えば三次元の空間的な配置についても、一瞬で理解することができるわけですが、そういったことは、今のディープラーニングではまだ十分にできていません。

　物を見たとき、空間の形状、あるいは空間的な配置を理解するような仕組みというものができてくるのですが、これは三次元の空間というものを仮定すると、深さ推定の技術とか三次元的に複数の画像から推定する技術とか、実はこれまでにもいろいろあるのですね。

　人間の知能、あるいは動物の知能でも同じですが、非常に興味深いのは、もともと赤ちゃんとして生まれてきたときには、世界が三次元であるということは知らないにもかかわらず、目で見て体を動かして、ということをやっているうちに、結局三次元だということに気づいているということです。これは、データの潜在的な低次元の構造、つまり次元数が減っているわけですね。三次元と解釈すると、非常につじつまが合う、整合的に説明できる。そういう構造を見つけ出しているのです。

　そういった、原初の背後にある低次元な構造を見つけ出す技術というものが、実は今までのディープラーニングには十分になかった。それゆえに空間の移動をするようなナビゲーションのタスクとか、あるいは、把持、「グラスプ」といいますが、そういう物をつかむようなタスクとか、組み立てるようなタスクなど、いろいろなものに空間的な認知、あるいはタスクのコツのようなものが必要とされているわけです。

　そうした今までできなかったことができるような技術が少しずつ出てきているのです。これを「世界モデル」といいますけれども、2018年、Deep Mind（ディープマインド）が「GQN（Generative Query Network）」という研究を出して、こういったあたりの技術が今後、進んでくるのではないかと思っています。