人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
科学と技術
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
2050年「プラチナ社会」実現への挑戦(1)「プラチナ社会」実現のルーツと現況
2025年頭所感~5つのプラチナ産業イニシアティブ創りへ
小宮山宏
2050年のための「前向きの愛国心」(1)木造都市へのシフト
木造ビルで20階…新しい暮らしを支える森林産業の確立を
小宮山宏
生成AI・大規模言語モデルのしくみ(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
岡野原大輔
ヒトの性差とジェンダー論(1)「性」とは何か
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
未来を知るための宇宙開発の歴史(1)宇宙開発の流れを概観する
宇宙開発の歴史、そして未来へ…6枚の写真で概観する
川口淳一郎

人気の講義ランキングTOP10
ヒトは共同保育~生物学から考える子育て(1)動物の配偶と子育てシステム
ヒトは共同保育の動物――生物学からみた子育ての基礎知識
長谷川眞理子
未来を知るための宇宙開発の歴史(7)米ソとは異なる日本の宇宙開発
日本の弾道ミサイル開発禁止!?米ソとは異なる宇宙開拓の道
川口淳一郎
「集権と分権」から考える日本の核心(3)中央集権と六国史の時代の終焉
天平期の天然痘で国民の3割が死亡?…大仏と崩れる律令制
片山杜秀
数学と音楽の不思議な関係(1)だれもがみんな数学者で音楽家
世界は数学と音楽でできている…歴史が物語る密接な関係
中島さち子
モンゴル帝国の世界史(2)チンギス・ハーンのカリスマ性
自由な多民族をモンゴルに統一したチンギス・ハーンの魅力
宮脇淳子
DEIの重要性と企業経営(4)人口統計的DEIと女性活躍推進の効果
日本的雇用慣行の課題…女性比率を高めても業績向上は難しい
山本勲
睡眠から考える健康リスクと社会的時差ボケ(5)シフトワークと健康問題
発がんリスク、心身の不調…シフトワークの悪影響に迫る
西多昌規
「アカデメイア」から考える学びの意義(1)学びを巡る3つの危機
「学びの危機」こそが現代社会と次世代への大きな危機
納富信留
知識創造戦略論~暗黙知から形式知へ(1)イノベーションと価値創造
価値創造において重要なのは未来から現在を見るという視点
遠山亮子
トランプ政権と「一寸先は闇」の国際秩序(3)これからの世界と底線思考の重要性
同盟国よもっと働け…急激に進んでいる「負担のシフト」
佐橋亮