人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
生成AI・大規模言語モデルのしくみ(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
岡野原大輔
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎

人気の講義ランキングTOP10
日本人とメンタルヘルス…心のあり方(1)米を食べる日本人と『分裂病と人類』
日本人の生きづらさの特徴は?~中井久夫著『分裂病と人類』
與那覇潤
ラフカディオ・ハーン『神国日本』を読む(7)日本の倫理こそ未来の理想
他人の幸福実現に喜びを見出す日本の道徳こそ未来の理想だ
賴住光子
編集部ラジオ2026(8)10分解説!第二の人生の仕事革命
年金の「働き損」解消時代!第二の人生を充実させる方法とは
テンミニッツ・アカデミー編集部
『還暦からの底力』に学ぶ人生100年時代の生き方(1)定年制は要らない
仕事をするのに「年齢」は関係ない…不幸を招く定年型思考
出口治明
大統領に告ぐ…硫黄島からの手紙の真実(2)翻訳に込めた日米の架け橋への夢
アメリカ人の心を震わせた20歳の日系二世・三上弘文の翻訳
門田隆将
これから必要な人材と人材教育とは?(3)無謬性とジョブローテーション
もうゼネラリストを育てる人事制度では時代に対応できない
柳川範之
ルネサンス美術の見方(4)レオナルド・ダ・ヴィンチ~前編~
「最初の近代人」レオナルド・ダ・ヴィンチの『受胎告知』
池上英洋
『孫子』を読む:地形篇(3)逆命利君の教えと絶対的勝利の条件
逆命利君か従命病君か――漢の時代から伝わる重要な戦略論
田口佳史
新撰組と幕末日本の「真実」(8)戊辰戦争~明治期の新撰組の魂
受け継がれる魂…戊辰戦争での奮戦と自由民権運動の情熱
堀口茉純
インフレの行方…歴史から将来を予測する(1)インフレの具体像を探る
270年の物価の歴史に学べ…急激な物価上昇期の特徴と教訓
養田功一郎