テンミニッツTV|有識者による1話10分のオンライン講義
会員登録 テンミニッツTVとは
社会人向け教養サービス 『テンミニッツTV』 が、巷の様々な豆知識や真実を無料でお届けしているコラムコーナーです。
DATE/ 2018.02.09

ディープラーニングだけではないAI進歩の秘密

 ディープラーニング(深層学習)によって、人工知能(AI)の画像認識精度が人間を超えたと騒がれたのが2015年。その成果はグーグルの「アルファGO」が囲碁チャンピオンを連破したことで世界に知られ、「AIにとってかわられる職業」が話題になりました。しかし、AIの進化に貢献したのはディープラーニングだけではありません。東京大学大学院工学系研究科技術経営戦略学専攻特任准教授でAI研究者の松尾豊氏に聞いてみましょう。

ディープラーニングで見直された「強化学習」

 松尾氏は、人工知能を研究開発する上でのレベルを4段階にまとめています。レベル1は「単純な制御プログラム」、レベル2は「古典的な人工知能」、レベル3は「機械学習ができる人工知能」、レベル4は「ディープラーニングを採り入れた人工知能」です。

 研究者たちがいま取り組んでいるのはレベル3とレベル4の段階なのですが、一般の家電で「AI」を称しているのはレベル1、質問対応ソフトや診断プログラムなどはレベル2で、一般人はあまりちゃんと区別せずに「AI」の言葉を使っています。

 また、すでにレベル4まで来ているなら、レベル3に戻る必要はないと思う人もいるでしょう。実はディープラーニングにより画像認識精度が上がったことと、ウェブなどにたまったビッグデータの組み合わせによって、機械学習の中でも「強化学習」が再度クローズアップされているのです。

偶然のラッキーをリピートするのが強化学習

 強化学習は、もう100年も前から研究が続けられてきた分野で、大雑把に言うと「行動を学習するしくみ」です。人間でいえば、サッカーボールを蹴っているうちにだんだん上手になるようなこと。「習うより慣れろ」と言われる習熟のプロセスには、たまたまうまく蹴ることができたときに、「今のはうまくいった」と感じて、その蹴り方を繰り返すというしくみが含まれているのです。

 「今のはうまくいった」と感じることは、脳の「報酬」になります。報酬が与えられることにより、行動が強化され、だんだん上手になっていく。これが強化学習のしくみなのですが、コンピュータにそれを覚えさせるには、「状況」と「行動」、そして「よかったか/悪かったか」をセットしなければなりません。

 これまでの強化学習では、「状況」を記述するのに、人間が定義した変数を使ってきました。ところが、ディープラーニングと組み合わせる方法にすると、画像認識で出てきた特徴量が使えます。違いはそこだけなのに、生まれた変化には非常に大きなものがあります。

状況がわかって、報酬があれば、熟練はできるのだ

 ディープラーニングと強化学習を組み合わせ、ゲームを学習するAIを作ったのが、ディープマインドという会社です。2013年にその技術を開発し、2014年にはグーグル社に買収されています。

 「ブロック崩し」も「スペースインベーダー」も、スコアを報酬と見ることにより、同じプログラムで学習させることができます。これまでだと、いちいち「これがインベーダー」「これがミサイル」「これが自分」という定義をしてやらないといけなかったのが、画像入力だけでOKになりました。

 この技術を応用すればロボットの行動に「熟練」が見られるようになることは、すぐに予測がつきます。2015年5月、カリフォルニア大学バークレー校は「試行錯誤しながら組み立て作業を行う」ロボットのBRETTを発表しました。

 考えてみると熟練は、人間だけが行なえる複雑なことではなく、犬でも猫でもできることです。AIに今までこれができなかったのは状況をつかむことができなかったから、と松尾氏は解説しています。

 状況がわかり、報酬のうまみをたっぷり浴びたAIは、これからどんなロボットに成長していくのでしょうか。
~最後までコラムを読んでくれた方へ~
「学ぶことが楽しい」方には 『テンミニッツTV』 がオススメです。
明日すぐには使えないかもしれないけど、10年後も役に立つ“大人の教養”を 5,500本以上。 『テンミニッツTV』 で人気の教養講義をご紹介します。
1

55年体制は民主主義的で、野党もブレーキ役に担っていた

55年体制は民主主義的で、野党もブレーキ役に担っていた

55年体制と2012年体制(1)質的な違いと野党がなすべきこと

戦後の日本の自民党一党支配体制は、現在の安倍政権における自民党一党支配と比べて、何がどのように違うのか。「55年体制」と「2012年体制」の違いと、民主党をはじめ現在の野党がなすべきことについて、ジェラルド・カ...
収録日:2014/11/18
追加日:2014/12/09
2

5Gはなぜワールドワイドで推進されていったのか

5Gはなぜワールドワイドで推進されていったのか

5Gとローカル5G(1)5G推進の背景

第5世代移動通信システムである5Gが、日本でもいよいよ導入される。世界中で5Gが導入されている背景には、2020年代に訪れるというデータ容量の爆発的な増大に伴う、移動通信システムの刷新がある。5Gにより、高精細動画のような...
収録日:2019/11/20
追加日:2019/12/01
中尾彰宏
東京大学 大学院工学系研究科 教授
3

マスコミは本来、与野党機能を果たすべき

マスコミは本来、与野党機能を果たすべき

マスコミと政治の距離~マスコミの使命と課題を考える

政治学者・曽根泰教氏が、マスコミと政治の距離を中心に、マスコミの使命と課題について論じる。日本の新聞は各社それぞれの立場をとっており、その報道の基本姿勢は「客観報道」である。公的異議申し立てを前提とする中立的報...
収録日:2015/05/25
追加日:2015/06/29
曽根泰教
慶應義塾大学名誉教授
4

BREXITのEU首脳会議での膠着

BREXITのEU首脳会議での膠着

BREXITの経緯と課題(6)EU首脳会議における膠着

2018年10月に行われたEU首脳会議について解説する。北アイルランドの国境問題をめぐって、解決案をイギリスが見つけられなければ、北アイルランドのみ関税同盟に残す案が浮上するも、メイ首相や強硬離脱派はこれに反発している...
収録日:2018/12/04
追加日:2019/03/16
島田晴雄
慶應義塾大学名誉教授
5

健康経営とは何か?取り組み方とメリット

健康経営とは何か?取り組み方とメリット

健康経営とは何か~その取り組みと期待される役割~

近年、企業における健康経営®の重要性が高まっている。少子高齢化による労働人口の減少が見込まれる中、労働力の確保と、生産性の向上は企業にとって最重要事項である。政府主導で進められている健康経営とは何か。それが提唱さ...
収録日:2021/07/29
追加日:2021/09/21
阿久津聡
一橋大学大学院経営管理研究科国際企業戦略専攻教授