テンミニッツ・アカデミー|有識者による1話10分のオンライン講義
会員登録 テンミニッツ・アカデミーとは
社会人向け教養サービス 『テンミニッツ・アカデミー』 が、巷の様々な豆知識や真実を無料でお届けしているコラムコーナーです。
DATE/ 2018.02.09

ディープラーニングだけではないAI進歩の秘密

 ディープラーニング(深層学習)によって、人工知能(AI)の画像認識精度が人間を超えたと騒がれたのが2015年。その成果はグーグルの「アルファGO」が囲碁チャンピオンを連破したことで世界に知られ、「AIにとってかわられる職業」が話題になりました。しかし、AIの進化に貢献したのはディープラーニングだけではありません。東京大学大学院工学系研究科技術経営戦略学専攻特任准教授でAI研究者の松尾豊氏に聞いてみましょう。

ディープラーニングで見直された「強化学習」

 松尾氏は、人工知能を研究開発する上でのレベルを4段階にまとめています。レベル1は「単純な制御プログラム」、レベル2は「古典的な人工知能」、レベル3は「機械学習ができる人工知能」、レベル4は「ディープラーニングを採り入れた人工知能」です。

 研究者たちがいま取り組んでいるのはレベル3とレベル4の段階なのですが、一般の家電で「AI」を称しているのはレベル1、質問対応ソフトや診断プログラムなどはレベル2で、一般人はあまりちゃんと区別せずに「AI」の言葉を使っています。

 また、すでにレベル4まで来ているなら、レベル3に戻る必要はないと思う人もいるでしょう。実はディープラーニングにより画像認識精度が上がったことと、ウェブなどにたまったビッグデータの組み合わせによって、機械学習の中でも「強化学習」が再度クローズアップされているのです。

偶然のラッキーをリピートするのが強化学習

 強化学習は、もう100年も前から研究が続けられてきた分野で、大雑把に言うと「行動を学習するしくみ」です。人間でいえば、サッカーボールを蹴っているうちにだんだん上手になるようなこと。「習うより慣れろ」と言われる習熟のプロセスには、たまたまうまく蹴ることができたときに、「今のはうまくいった」と感じて、その蹴り方を繰り返すというしくみが含まれているのです。

 「今のはうまくいった」と感じることは、脳の「報酬」になります。報酬が与えられることにより、行動が強化され、だんだん上手になっていく。これが強化学習のしくみなのですが、コンピュータにそれを覚えさせるには、「状況」と「行動」、そして「よかったか/悪かったか」をセットしなければなりません。

 これまでの強化学習では、「状況」を記述するのに、人間が定義した変数を使ってきました。ところが、ディープラーニングと組み合わせる方法にすると、画像認識で出てきた特徴量が使えます。違いはそこだけなのに、生まれた変化には非常に大きなものがあります。

状況がわかって、報酬があれば、熟練はできるのだ

 ディープラーニングと強化学習を組み合わせ、ゲームを学習するAIを作ったのが、ディープマインドという会社です。2013年にその技術を開発し、2014年にはグーグル社に買収されています。

 「ブロック崩し」も「スペースインベーダー」も、スコアを報酬と見ることにより、同じプログラムで学習させることができます。これまでだと、いちいち「これがインベーダー」「これがミサイル」「これが自分」という定義をしてやらないといけなかったのが、画像入力だけでOKになりました。

 この技術を応用すればロボットの行動に「熟練」が見られるようになることは、すぐに予測がつきます。2015年5月、カリフォルニア大学バークレー校は「試行錯誤しながら組み立て作業を行う」ロボットのBRETTを発表しました。

 考えてみると熟練は、人間だけが行なえる複雑なことではなく、犬でも猫でもできることです。AIに今までこれができなかったのは状況をつかむことができなかったから、と松尾氏は解説しています。

 状況がわかり、報酬のうまみをたっぷり浴びたAIは、これからどんなロボットに成長していくのでしょうか。
~最後までコラムを読んでくれた方へ~
雑学から一段上の「大人の教養」はいかがですか?
明日すぐには使えないかもしれないけど、10年後も役に立つ“大人の教養”を 5,600本以上。 『テンミニッツ・アカデミー』 で人気の教養講義をご紹介します。
1

人間はどうやって「理解する」のか?『学力喪失』から考える

人間はどうやって「理解する」のか?『学力喪失』から考える

学力喪失の危機~言語習得と理解の本質(1)数が理解できない子どもたち

たかが「1」、されど「1」――今、数の意味が理解できない子どもがたくさんいるという。そもそも私たちは、「1」という概念を、いつ、どのように理解していったのか。あらためて考え出すと不思議な、言葉という抽象概念の習得プロ...
収録日:2025/05/12
追加日:2025/10/06
今井むつみ
一般社団法人今井むつみ教育研究所代表理事 慶應義塾大学名誉教授
2

一強独裁=1人独裁の光と影…「強い中国」への動機と限界

一強独裁=1人独裁の光と影…「強い中国」への動機と限界

習近平中国の真実…米中関係・台湾問題(1)習近平の歴史的特徴とは?

「習近平中国」「習近平時代」における中国内政の特徴を見る上では、それ以前との比較が欠かせない。「中国は、毛沢東により立ち上がり、鄧小平により豊かになり、そして習近平により強くなる」という彼自身の言葉通りの路線が...
収録日:2025/07/01
追加日:2025/09/25
垂秀夫
元日本国駐中華人民共和国特命全権大使
3

軍政から民政へ、なぜ李登輝はこの難業に成功したのか

軍政から民政へ、なぜ李登輝はこの難業に成功したのか

クーデターの条件~台湾を事例に考える(4)クーデター後の民政移管とその方策

台湾でのクーデターを想定したとき、重要になるのがその成功後の民政移管である。それは民主主義を標榜する民進党の正統性を保つためであるが、それはいったいどのように果たされうるのか。一度は民主化に成功した李登輝政権時...
収録日:2025/07/23
追加日:2025/10/11
上杉勇司
早稲田大学国際教養学部・国際コミュニケーション研究科教授 沖縄平和協力センター副理事長
4

仕事をするのに「年齢」は関係ない…不幸を招く定年型思考

仕事をするのに「年齢」は関係ない…不幸を招く定年型思考

『還暦からの底力』に学ぶ人生100年時代の生き方(1)定年制は要らない

新著『還暦からの底力』のなかには、「人生100年時代」を幸せに送るためのヒントが詰まっている。今回のシリーズでは、その本をもとに考え方の軸を根本から変える秘訣を伺った。その一つが「定年型社会」に対する提言だ。本人が...
収録日:2020/06/30
追加日:2020/08/01
出口治明
立命館アジア太平洋大学(APU)学長特命補佐
5

伊能忠敬に学ぶ、人生を高めて充実させる「工夫と覚悟」

伊能忠敬に学ぶ、人生を高めて充実させる「工夫と覚悟」

伊能忠敬に学ぶ「第二の人生」の生き方(1)少年時代

伊能忠敬の生涯を通して第二の人生の生き方、セカンドキャリアについて考えるシリーズ講話。九十九里の大きな漁師宿に生まれ育った忠敬だが、船稼業に向かない父親と親方である祖父との板ばさみに悩む少年時代だった。複雑な家...
収録日:2020/01/09
追加日:2020/03/01