テンミニッツTV|有識者による1話10分のオンライン講義
会員登録 テンミニッツTVとは
社会人向け教養サービス 『テンミニッツTV』 が、巷の様々な豆知識や真実を無料でお届けしているコラムコーナーです。
DATE/ 2018.02.09

ディープラーニングだけではないAI進歩の秘密

 ディープラーニング(深層学習)によって、人工知能(AI)の画像認識精度が人間を超えたと騒がれたのが2015年。その成果はグーグルの「アルファGO」が囲碁チャンピオンを連破したことで世界に知られ、「AIにとってかわられる職業」が話題になりました。しかし、AIの進化に貢献したのはディープラーニングだけではありません。東京大学大学院工学系研究科技術経営戦略学専攻特任准教授でAI研究者の松尾豊氏に聞いてみましょう。

ディープラーニングで見直された「強化学習」

 松尾氏は、人工知能を研究開発する上でのレベルを4段階にまとめています。レベル1は「単純な制御プログラム」、レベル2は「古典的な人工知能」、レベル3は「機械学習ができる人工知能」、レベル4は「ディープラーニングを採り入れた人工知能」です。

 研究者たちがいま取り組んでいるのはレベル3とレベル4の段階なのですが、一般の家電で「AI」を称しているのはレベル1、質問対応ソフトや診断プログラムなどはレベル2で、一般人はあまりちゃんと区別せずに「AI」の言葉を使っています。

 また、すでにレベル4まで来ているなら、レベル3に戻る必要はないと思う人もいるでしょう。実はディープラーニングにより画像認識精度が上がったことと、ウェブなどにたまったビッグデータの組み合わせによって、機械学習の中でも「強化学習」が再度クローズアップされているのです。

偶然のラッキーをリピートするのが強化学習

 強化学習は、もう100年も前から研究が続けられてきた分野で、大雑把に言うと「行動を学習するしくみ」です。人間でいえば、サッカーボールを蹴っているうちにだんだん上手になるようなこと。「習うより慣れろ」と言われる習熟のプロセスには、たまたまうまく蹴ることができたときに、「今のはうまくいった」と感じて、その蹴り方を繰り返すというしくみが含まれているのです。

 「今のはうまくいった」と感じることは、脳の「報酬」になります。報酬が与えられることにより、行動が強化され、だんだん上手になっていく。これが強化学習のしくみなのですが、コンピュータにそれを覚えさせるには、「状況」と「行動」、そして「よかったか/悪かったか」をセットしなければなりません。

 これまでの強化学習では、「状況」を記述するのに、人間が定義した変数を使ってきました。ところが、ディープラーニングと組み合わせる方法にすると、画像認識で出てきた特徴量が使えます。違いはそこだけなのに、生まれた変化には非常に大きなものがあります。

状況がわかって、報酬があれば、熟練はできるのだ

 ディープラーニングと強化学習を組み合わせ、ゲームを学習するAIを作ったのが、ディープマインドという会社です。2013年にその技術を開発し、2014年にはグーグル社に買収されています。

 「ブロック崩し」も「スペースインベーダー」も、スコアを報酬と見ることにより、同じプログラムで学習させることができます。これまでだと、いちいち「これがインベーダー」「これがミサイル」「これが自分」という定義をしてやらないといけなかったのが、画像入力だけでOKになりました。

 この技術を応用すればロボットの行動に「熟練」が見られるようになることは、すぐに予測がつきます。2015年5月、カリフォルニア大学バークレー校は「試行錯誤しながら組み立て作業を行う」ロボットのBRETTを発表しました。

 考えてみると熟練は、人間だけが行なえる複雑なことではなく、犬でも猫でもできることです。AIに今までこれができなかったのは状況をつかむことができなかったから、と松尾氏は解説しています。

 状況がわかり、報酬のうまみをたっぷり浴びたAIは、これからどんなロボットに成長していくのでしょうか。
~最後までコラムを読んでくれた方へ~
“社会人学習”できていますか? 『テンミニッツTV』 なら手軽に始められます。
明日すぐには使えないかもしれないけど、10年後も役に立つ“大人の教養”を 5,600本以上。 『テンミニッツTV』 で人気の教養講義をご紹介します。
1

田沼意次とは?再評価で注目の人物像と時代背景に迫る

田沼意次とは?再評価で注目の人物像と時代背景に迫る

田沼意次の革新力~産業・流通・貨幣経済(1)田沼意次の生い立ちとその時代

田沼意次の人物像と政策を通して、江戸時代の転換期を振り返る今シリーズ。農産物・工産物の流通・発展、また貨幣経済の拡大など、田沼時代の特徴を振り返る。まずは、田沼意次の生涯である。田沼意次の父は一説には浪人だった...
収録日:2025/01/28
追加日:2025/05/30
養田功一郎
元三井住友DSアセットマネジメント執行役員
2

あなたは縄文系?弥生系?…弥生時代の実態に迫る

あなたは縄文系?弥生系?…弥生時代の実態に迫る

編集部ラジオ2025(10)弥生人の遺伝子、生活、文化

「自分は縄文系だろうか? それとも弥生系だろうか?」。そんなことを、ふと考えたことはありませんか。

日本は、縄文系の遺伝子や文化がいまなお色濃く残りつつ、そこに弥生系の遺伝子・文化が絶妙に混交して、独...
収録日:2024/04/03
追加日:2025/05/29
テンミニッツTV編集部
教養動画メディア
3

その後の余命が変わる!続けるべき良い生活習慣とは

その後の余命が変わる!続けるべき良い生活習慣とは

健診結果から考える健康管理・新5カ条(7)良い生活習慣が健康寿命を延ばす

健康診断の結果に一喜一憂するだけではなく、そのデータを活用し、生活習慣を見直すことが大切である。今回は、内臓脂肪の管理が健康維持に直結する理由や、体重増加と糖尿病リスクの関係、さらには良い生活習慣が寿命に与える...
収録日:2025/01/10
追加日:2025/05/27
野口緑
大阪大学大学院医学系研究科 公衆衛生学 特任准教授
4

なぜ日本の医療はテロに対応できないのか?三つの理由

なぜ日本の医療はテロに対応できないのか?三つの理由

医療から考える国家安全保障上の脅威(5)日本の医療の問題点と提言

残念なことだが、現在の日本の医療はテロ攻撃には対応できない。その理由として、テロの悪意に対して無防備なこと、時代遅れの教科書的知識しか持っていないこと、テロで想定される健康被害に対応できる医療体制にないこと、が...
収録日:2024/09/20
追加日:2025/05/29
山口芳裕
杏林大学医学部教授
5

人生100年時代の生き方と日本の3つの課題

人生100年時代の生き方と日本の3つの課題

長寿社会の課題と可能性(1)個人・社会・産業の課題

東京大学高齢社会総合研究機構の秋山弘子特任教授が、人生100年時代を迎えた日本の課題について解説する。高齢化が急速に進み、健康で長生きできるようになった現在の日本では、それまでの人生50年時代の生き方やインフラ、産業...
収録日:2017/04/12
追加日:2017/05/01
秋山弘子
東京大学名誉教授