この講義シリーズの第1話は
登録不要で無料視聴できます!
ディープラーニング最前線
ディープラーニングを使った事例を技術面から分析して解説
ディープラーニング最前線(2)最新の画像認識技術
科学と技術
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
東京大学大学院工学系研究科准教授・松尾豊氏によるディープラーニング技術の最前線。今回は、ディープラーニングの画像認識技術の向上とは具体的にどういう意味を持つのかという点を、実際の商品事例も交えながら解説する。(全4話中第2話)
時間:10分13秒
収録日:2016年4月20日
追加日:2016年8月9日
収録日:2016年4月20日
追加日:2016年8月9日
カテゴリー:
≪全文≫
●画像認識の精度アップの鍵-特徴量を自分でつくり出す
ディープラーニングでできることは画像認識なのですが、従来だと人間が見れば「イヌ、ネコ、オオカミ」と一目で分かるものも、コンピューターで認識させることが非常に難しかったわけです。
例えば、「イヌ、ネコ、オオカミ」の3つを見分けたいとき、耳の形とか目の形に注目するといいのではないかということで、普通に考えると「耳が垂れていて目が長ければイヌだろう」、「耳がとがって目が長ければオオカミだろう」といったルールをつくります。
ところが、そうすると、「耳がとがっていて目が長いのだけれど、オオカミじゃなくてイヌですよ」という例外がたくさん発生するわけですね。結局、人間が、「耳が垂れている」とか「目が長い」といった特徴量を見ている限りはどうやっても無理で、その特徴量自体を自分でつくり出せるようにならないと精度は上がらないということです。これができるようになっているのがディープラーニングということです。まず画像認識によって圧倒的に精度が上がりました。昨年の時点で、すでに人間の認識精度を超えるところまで来ています。
●ディープラーニング第二段階-運動の習熟
その後、どういうことが起こるかというと、これも以前ご説明した通りですけれども、運動能力、つまり運動の習熟ということができるようになります。人間も動物も同じことをやっていると、だんだん上手になっていきます。それと同じことができるようになるのです。
要するに、認識ができるということは目が見えるようになったということです。今までロボットや機械には、カメラがありました。これは一見、目があるように思うのですが、認識できていなかったのです。裏側の処理系が非常に貧弱だったので、カメラがあっても目が見えていなかったのです。それが今は見えるようになったということです。そうすると、人間が見て見分けられるものは見分けられますし、見分けた上で「こういう状況ではこういうことをしたらいいんだ」ということが学習できるので、動き方も上手になるのです。
●言語の意味理解へ-文と体験の相互変換能力の獲得
そして、そのうち言語の意味理解というところに至ります。今までは自然言語処理、つまり言語をコンピューターで扱う技術はあったのですが、意味理解を一切していなかったのです。例えば、「...
●画像認識の精度アップの鍵-特徴量を自分でつくり出す
ディープラーニングでできることは画像認識なのですが、従来だと人間が見れば「イヌ、ネコ、オオカミ」と一目で分かるものも、コンピューターで認識させることが非常に難しかったわけです。
例えば、「イヌ、ネコ、オオカミ」の3つを見分けたいとき、耳の形とか目の形に注目するといいのではないかということで、普通に考えると「耳が垂れていて目が長ければイヌだろう」、「耳がとがって目が長ければオオカミだろう」といったルールをつくります。
ところが、そうすると、「耳がとがっていて目が長いのだけれど、オオカミじゃなくてイヌですよ」という例外がたくさん発生するわけですね。結局、人間が、「耳が垂れている」とか「目が長い」といった特徴量を見ている限りはどうやっても無理で、その特徴量自体を自分でつくり出せるようにならないと精度は上がらないということです。これができるようになっているのがディープラーニングということです。まず画像認識によって圧倒的に精度が上がりました。昨年の時点で、すでに人間の認識精度を超えるところまで来ています。
●ディープラーニング第二段階-運動の習熟
その後、どういうことが起こるかというと、これも以前ご説明した通りですけれども、運動能力、つまり運動の習熟ということができるようになります。人間も動物も同じことをやっていると、だんだん上手になっていきます。それと同じことができるようになるのです。
要するに、認識ができるということは目が見えるようになったということです。今までロボットや機械には、カメラがありました。これは一見、目があるように思うのですが、認識できていなかったのです。裏側の処理系が非常に貧弱だったので、カメラがあっても目が見えていなかったのです。それが今は見えるようになったということです。そうすると、人間が見て見分けられるものは見分けられますし、見分けた上で「こういう状況ではこういうことをしたらいいんだ」ということが学習できるので、動き方も上手になるのです。
●言語の意味理解へ-文と体験の相互変換能力の獲得
そして、そのうち言語の意味理解というところに至ります。今までは自然言語処理、つまり言語をコンピューターで扱う技術はあったのですが、意味理解を一切していなかったのです。例えば、「...
「科学と技術」でまず見るべき講義シリーズ
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
人気の講義ランキングTOP10
ヒトは共同保育の動物――生物学からみた子育ての基礎知識
長谷川眞理子