人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
科学と技術
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
ヒトの性差とジェンダー論(1)「性」とは何か
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
未来を知るための宇宙開発の歴史(1)宇宙開発の流れを概観する
宇宙開発の歴史、そして未来へ…6枚の写真で概観する
川口淳一郎
海底の仕組みと地球のメカニズム(1)海底の生まれるところ
地球上の火山活動の8割を占める「中央海嶺」とは何か
沖野郷子
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎

人気の講義ランキングTOP10
数学と音楽の不思議な関係(4)STEAM教育でつくる喜びを全ての人に
世界で最もクリエイティブな国は? STEAM教育が広がる理由
中島さち子
続・日本人の「所得の謎」徹底分析(2)政府債務と預金残高の背景
なぜ日本の所得水準は低いのに預金残高は大きいのか
養田功一郎
経験学習を促すリーダーシップ(2)経験から学ぶ力
米長邦雄のアンラーニング、弟子の弟子になってV字成長
松尾睦
戦前日本の「未完のファシズム」と現代(8)満州事変と世界大恐慌
「100年戦争」と考えて戦争に突入した日本の現実
片山杜秀
「集権と分権」から考える日本の核心(5)島国という地理的条件と高い森林率
各々の地でそれぞれ勝手に…森林率が高い島国・日本の特徴
片山杜秀
海底の仕組みと地球のメカニズム(1)海底の生まれるところ
地球上の火山活動の8割を占める「中央海嶺」とは何か
沖野郷子
50代からの親の介護~その課題と準備(1)突然やってくる介護の問題
「親の介護」の問題…優しさだけでは続かない
太田差惠子
弥生人の実態~研究結果が明かす生活と文化(1)弥生時代はいつ始まったのか
なぜ弥生時代の始まりが600年も改まった?定説改訂の背景
藤尾慎一郎
編集部ラジオ2025(20)納富信留先生の「アカデメイア」講義
プラトンのアカデメイアからテンミニッツ・アカデミーへ
テンミニッツ・アカデミー編集部
第2の人生を明るくする労働市場改革(1)日本の労働市場が抱える問題
シニアの雇用、正規・非正規の格差…日本の労働市場の問題
宮本弘曉