人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
海底の仕組みと地球のメカニズム(1)海底の生まれるところ
地球上の火山活動の8割を占める「中央海嶺」とは何か
沖野郷子
航空機事故ゼロをめざして(1)フラッター現象とは何か
零戦の開発段階で起きたフラッター現象…事故の教訓とは
鈴木真二
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
断熱から考える一年中快適で健康な住環境(1)日本の住宅の実態と問題点
なぜ日本は夏暑く、冬寒いのか…断熱から考える住宅の問題
前真之
ヒトの性差とジェンダー論(1)「性」とは何か
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
「海の哺乳類」の生き残り作戦(1)分類と海牛目の特徴
「海の哺乳類」が海の中で行った「生き残り作戦」とは
田島木綿子

人気の講義ランキングTOP10
徳と仏教の人生論(1)経営者の条件と50年間悩み続けた命題
宇宙の理法――松下幸之助からの命題が50年後に解けた理由
田口佳史
何回説明しても伝わらない問題と認知科学(1)「スキーマ」問題と認知の仕組み
なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み
今井むつみ
エンタテインメントビジネスと人的資本経営(6)評価制度設計と「夢」の重要性
なぜ二本立ての評価制度が必要か…多種多様な人材の評価法
水野道訓
いま夏目漱石の前期三部作を読む(1)夏目漱石を読み直す意味
メンタルが苦しくなったら?…今、夏目漱石を読み直す意味
與那覇潤
ケルト神話の基本を知る(1)ケルト地域と3つの神話群
ケルト神話とは…ダーナ神族、アルスター神話、フィアナ神話
鎌田東二
クーデターの条件~台湾を事例に考える(1)クーデターとは何か
台湾でクーデターは起きるのか?想定シナリオとその可能性
上杉勇司
学力喪失の危機~言語習得と理解の本質(2)言葉を理解するプロセスとスキーマ
なぜ子どもは教えられても理解できないのか?鍵はスキーマ
今井むつみ
習近平中国の真実…米中関係・台湾問題(1)習近平の歴史的特徴とは?
一強独裁=1人独裁の光と影…「強い中国」への動機と限界
垂秀夫
経験学習を促すリーダーシップ(1)経験学習の基本
成長を促す「3つの経験」とは?経験学習の基本を学ぶ
松尾睦
東大ハチ公物語―人と犬の関係(1)上野英三郎博士とハチ
忠犬ハチ公で哲学する…人と犬の関係から見えてくる道徳論
一ノ瀬正樹