人工知能のディープな可能性
この講義シリーズの第1話
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
強化学習とディープラーニングでロボットが自動的に習熟
人工知能のディープな可能性(2)自ら学習するロボット
松尾豊(東京大学大学院工学系研究科 人工物工学研究センター/技術経営戦略学専攻長 教授)
画像認識の精度を飛躍的に向上させたディープラーニングは、「強化学習」と組み合わせることで、自ら学習するロボットを生み出した。この技術を使えば、ルールややり方すら教えなくても、ロボットは自動的にゲームに習熟し、おもちゃを組み立てられようになる。東京大学大学院工学系研究科准教授・松尾豊氏が、最新事例を解説する。(全4話中第2話) ※テキストの文中に参考動画(YouTube)へのリンクがありますので、併せてご覧ください。
時間:12分39秒
収録日:2016年1月15日
追加日:2016年5月12日
≪全文≫

●「強化学習」にディープラーニングを組み込む


 画像認識の精度は、今すごく上がっていますが、それと同時に、すごく面白いことが起こっています。画像認識と強化学習、ディープラーニングと強化学習を組み合わせるという技術が出てきています。

 強化学習とは、大雑把に言うと「行動を学習する仕組み」です。これはもう100年ぐらい前から研究されています。例えば人間は、サッカーボールを蹴っているうちに、だんだん上手に蹴ることができるようになります。なぜ上手に蹴ることができるようになるかというと、たまたま上手く蹴ることができたら、「今のは上手く蹴ることができた」と思って、その蹴り方を繰り返すからですね。

 このように「上手く蹴らることができたな」と思えることを、「報酬」と言います。報酬が与えられると、その前にやった行動を強化する。こういう仕組みによって、行動がだんだん上手になってくるのです。犬にお手を教えるというときにどうやるかというと、たまたま犬がお手をしたらエサをあげるということを繰り返していく。すると、お手をするようになるわけです。これは犬から見ると、エサという報酬がもらえた前にやった行動を強化しているわけですね。

 これが強化学習の仕組みです。犬も、いつもお手をしていればいいわけではなく、ご主人さまが「お手をしなさい」と言ったときにお手をするといいわけですね。ですから、どういう状況でどういう行動をすると良かったか、あるいは悪かったか、すなわち「状況」と「行動」、そして「良かったか/悪かったか」、これらをセットにして、コンピュータに学習させていくわけです。


●ブロック崩しのテクニックを「学ぶ」人工知能


 今までの強化学習では、「どういう状況で」という「状況」の記述をするのに、人間が定義した変数を使っていたのです。ところが、このディープラーニングと組み合わせる方法では、「状況」の記述にディープラーニングで画像認識をして出てきた特徴量を使うことで、その変数を人間がつくらなくてよくなります。後の部分は、今までの強化学習と一緒です。違いはそこにしかないのですが、それによって非常に大きな変化が起こります。

 動画をお見せします。まず2013年後半の研究です。ディープマインドという会社がありまして、これは2014年初頭にGoogleに買収された会社です。この会社がどういうことをやった...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子
Beyond5G・6Gで進む情報通信の民主化(1)情報通信の民主化と「協創」
6Gの研究開発を推進する情報通信の民主化
中尾彰宏
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
ChatGPT~AIと人間の未来(1)ChatGPTは何ができて、何ができないか
ChatGPTは考えてない?…「AIの回答」の本質とは
西垣通
「進化」への誤解…本当は何か?(1)進化の意味と生物学としての歴史
実は生物の「進化」とは「物事が良くなる」ことではない
長谷川眞理子

人気の講義ランキングTOP10
お金とは何か?…金本位制とビットコイン(3)ビットコインの革新と矛盾
暗号通貨は従来の通貨と何が違うか…ビットコインの矛盾点
養田功一郎
人の行動の「なぜ」を読み解く行動分析学(1)随伴性
三日坊主、部屋が片付かない…なぜできないか行動分析学で考える
島宗理
教養としての「ユダヤ人の歴史とユダヤ教」(5)キリスト教と反ユダヤ思想
ユダヤ人迫害を生んだ「権力者・ユダヤ人・民衆」の三者関係
鶴見太郎
イラン戦争とトランプ大統領の戦争指導(3)戦争終結シナリオと大統領選挙の行方
MAGA連合に亀裂!?イラン戦争が及ぼす大統領選への影響
東秀敏
これから必要な人材と人材教育とは?(2)AI時代に必要とされる能力
AI時代に必要なのは「問いを立てる能力」…いかに育成するか
柳川範之
本質から考えるコンプライアンスと内部統制(4)事例からみる内部統制の実際
過剰なルールベースの内部統制は百害あって一利なし
國廣正
新撰組と幕末日本の「真実」(序)『ちるらん 新撰組鎮魂歌』の魅力と史実の絶妙さ
新撰組と『ちるらん 新撰組鎮魂歌』…群像劇としての魅力の源泉に迫る!
堀口茉純
大統領に告ぐ…硫黄島からの手紙の真実(2)翻訳に込めた日米の架け橋への夢
アメリカ人の心を震わせた20歳の日系二世・三上弘文の翻訳
門田隆将
ユダヤ神話の基本を知る
ユダヤ教の神話…天地創造、モーセの十戒、死後の世界
鎌田東二
小澤開作と満洲事変・日中戦争(1)少年時代の苦労と五族協和の夢
満洲で「五族協和」に命を懸けた小澤征爾の父・小澤開作
小澤俊夫