社会人向け教養サービス 『テンミニッツ・アカデミー』 が、巷の様々な豆知識や真実を無料でお届けしているコラムコーナーです。
DATE/ 2018.02.09

ディープラーニングだけではないAI進歩の秘密

 ディープラーニング(深層学習)によって、人工知能(AI)の画像認識精度が人間を超えたと騒がれたのが2015年。その成果はグーグルの「アルファGO」が囲碁チャンピオンを連破したことで世界に知られ、「AIにとってかわられる職業」が話題になりました。しかし、AIの進化に貢献したのはディープラーニングだけではありません。東京大学大学院工学系研究科技術経営戦略学専攻特任准教授でAI研究者の松尾豊氏に聞いてみましょう。

ディープラーニングで見直された「強化学習」

 松尾氏は、人工知能を研究開発する上でのレベルを4段階にまとめています。レベル1は「単純な制御プログラム」、レベル2は「古典的な人工知能」、レベル3は「機械学習ができる人工知能」、レベル4は「ディープラーニングを採り入れた人工知能」です。

 研究者たちがいま取り組んでいるのはレベル3とレベル4の段階なのですが、一般の家電で「AI」を称しているのはレベル1、質問対応ソフトや診断プログラムなどはレベル2で、一般人はあまりちゃんと区別せずに「AI」の言葉を使っています。

 また、すでにレベル4まで来ているなら、レベル3に戻る必要はないと思う人もいるでしょう。実はディープラーニングにより画像認識精度が上がったことと、ウェブなどにたまったビッグデータの組み合わせによって、機械学習の中でも「強化学習」が再度クローズアップされているのです。

偶然のラッキーをリピートするのが強化学習

 強化学習は、もう100年も前から研究が続けられてきた分野で、大雑把に言うと「行動を学習するしくみ」です。人間でいえば、サッカーボールを蹴っているうちにだんだん上手になるようなこと。「習うより慣れろ」と言われる習熟のプロセスには、たまたまうまく蹴ることができたときに、「今のはうまくいった」と感じて、その蹴り方を繰り返すというしくみが含まれているのです。

 「今のはうまくいった」と感じることは、脳の「報酬」になります。報酬が与えられることにより、行動が強化され、だんだん上手になっていく。これが強化学習のしくみなのですが、コンピュータにそれを覚えさせるには、「状況」と「行動」、そして「よかったか/悪かったか」をセットしなければなりません。

 これまでの強化学習では、「状況」を記述するのに、人間が定義した変数を使ってきました。ところが、ディープラーニングと組み合わせる方法にすると、画像認識で出てきた特徴量が使えます。違いはそこだけなのに、生まれた変化には非常に大きなものがあります。

状況がわかって、報酬があれば、熟練はできるのだ

 ディープラーニングと強化学習を組み合わせ、ゲームを学習するAIを作ったのが、ディープマインドという会社です。2013年にその技術を開発し、2014年にはグーグル社に買収されています。

 「ブロック崩し」も「スペースインベーダー」も、スコアを報酬と見ることにより、同じプログラムで学習させることができます。これまでだと、いちいち「これがインベーダー」「これがミサイル」「これが自分」という定義をしてやらないといけなかったのが、画像入力だけでOKになりました。

 この技術を応用すればロボットの行動に「熟練」が見られるようになることは、すぐに予測がつきます。2015年5月、カリフォルニア大学バークレー校は「試行錯誤しながら組み立て作業を行う」ロボットのBRETTを発表しました。

 考えてみると熟練は、人間だけが行なえる複雑なことではなく、犬でも猫でもできることです。AIに今までこれができなかったのは状況をつかむことができなかったから、と松尾氏は解説しています。

 状況がわかり、報酬のうまみをたっぷり浴びたAIは、これからどんなロボットに成長していくのでしょうか。
~最後までコラムを読んでくれた方へ~
物知りもいいけど知的な教養人も“あり”だと思います。
明日すぐには使えないかもしれないけど、10年後も役に立つ“大人の教養”を 5,600本以上。 『テンミニッツ・アカデミー』 で人気の教養講義をご紹介します。
1

なぜ空海が現代社会に重要か――新しい社会の創造のために

なぜ空海が現代社会に重要か――新しい社会の創造のために

エネルギーと医学から考える空海が拓く未来(1)サイバー・フィジカル融合と心身一如

現代社会にとって空海の思想がいかに重要か。AIが仕事の仕組みを変え、超高齢社会が医療の仕組みを変え、高度化する情報・通信ネットワークが生活の仕組みを変えたが、それらによって急激な変化を遂げた現代社会に将来不安が増...
収録日:2025/03/03
追加日:2025/11/12
2

『武功夜話』は偽書か?…疑われた理由と執筆動機の評価

『武功夜話』は偽書か?…疑われた理由と執筆動機の評価

歴史の探り方、活かし方(5)史実・史料分析:秀吉と秀次編〈下〉

豊臣秀次事件に対する見方を変えた『武功夜話』だが、実は偽書疑惑もある。今回は、そのことに鋭く迫っていく。『武功夜話』は、豊臣秀吉に仕えて大名まで上り詰めた前野長康の功績を中心に記された史料だが、その発表・出版の...
収録日:2025/04/26
追加日:2025/11/28
3

日本企業が世界のビジネスに乗り遅れた要因はオウンゴール

日本企業が世界のビジネスに乗り遅れた要因はオウンゴール

内側から見たアメリカと日本(6)日本企業の敗因は二つのオウンゴール

日本企業が世界のビジネスに乗り遅れた主な要因として、二つのオウンゴールを挙げる島田氏。その一つとして台湾のモリス・チャン氏によるTSMC立ち上げの話を取り上げるが、日本はその動きに興味を示さず、かつて世界を席巻して...
収録日:2025/09/02
追加日:2025/11/25
4

歴史作家・中村彰彦先生に学ぶ歴史の探り方、活かし方

歴史作家・中村彰彦先生に学ぶ歴史の探り方、活かし方

編集部ラジオ2025(29)歴史作家の舞台裏を学べる

この人生を生きていくうえで、「歴史」をひもとくと貴重なヒントにいくつも出会えます。では、実際にはどのように歴史をひもといていけばいいのか。

今回の編集部ラジオでは、歴史作家の中村彰彦先生がご自身の方法論...
収録日:2025/10/17
追加日:2025/11/27
5

なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み

なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み

何回説明しても伝わらない問題と認知科学(1)「スキーマ」問題と認知の仕組み

なぜ「何回説明しても伝わらない」という現象は起こるのか。対人コミュニケーションにおいて誰もが経験する理解や認識の行き違いだが、私たちは同じ言語を使っているのになぜすれ違うのか。この謎について、ベストセラー『「何...
収録日:2025/05/12
追加日:2025/11/02
今井むつみ
一般社団法人今井むつみ教育研究所代表理事 慶應義塾大学名誉教授