人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
新しい循環文明への道(1)採掘文明から循環文明へ
2026年頭所感~循環文明の「三つの柱」…いよいよ実現へ
小宮山宏
水から考える「持続可能」な未来(1)気候変動の現在地
最悪10メートル以上海面上昇…将来に禍根残す温暖化の影響
沖大幹
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子

人気の講義ランキングTOP10
哲学から考える日本の課題~正しさとは何か(1)言葉の正しさとは
「正しい言葉とは何か」とは、古来議論されているテーマ
中島隆博
AI時代と人間の再定義(5)AI親友論と「WE」という概念の問題
AI親友論って何?「Self-as-WE」と京都学派の思想
中島隆博
編集部ラジオ2026(2)「時代の大転換期の選挙」特集を解説!
「大転換期の選挙」の前に見ておきたい名講義を一挙紹介
テンミニッツ・アカデミー編集部
これからの社会・経済の構造変化(4)日本企業の課題と組織改革の壁
日本の場合、トップダウンよりボトムアップで変えるべき?
柳川範之
ポスト国連と憲法9条・安保(1)国連の構造的問題
核保有する国連常任理事国は、むしろ安心して戦争できる
橋爪大三郎
危機のデモクラシー…公共哲学から考える(6)政治と経済をつなぐ公共哲学
どのような経済レジームを選ぶか…倫理資本主義の可能性
齋藤純一
編集部ラジオ2025(31)絵で語る葛飾北斎と応為
葛飾北斎と応為の見事な「画狂人生」を絵と解説で辿る
テンミニッツ・アカデミー編集部
エネルギーと医学から考える空海が拓く未来(6)曼荼羅の世界と未来のネットワーク
命は光なのだ…曼荼羅を読み解いて見えてくる空海のすごさ
鎌田東二
内側から見たアメリカと日本(7)ジャパン・アズ・ナンバーワンの弊害
ジャパン・アズ・ナンバーワンで満足!?学ばない日本の弊害
島田晴雄
会計検査から見えてくる日本政治の実態(3)戦後初となる補正予算の検査
繰越金が4割も…戦後初「補正予算の会計検査」の実態
田中弥生