●衝撃的だったアルファ碁対トップ棋士の対戦結果
東京大学大学院工学系研究科准教授の松尾豊です。ディープラーニングの動向とこれからの可能性などについて話していきたいと思います。
先日、人工知能の「アルファ碁」が囲碁でトップ棋士の一人である李世ドル(イ・セドル)さんに勝ったという出来事がありました。Googleのディープマインドいう会社が開発したプログラムが「アルファ碁」なのですが、4勝1敗で勝ったということで、かなり関係者にとって驚きでした。
囲碁は、将棋やチェス、あるいはオセロ、こういう一連の思考ゲームの中で最も難しいとされています。チェスでコンピューターが人間に勝ったのは1997年で、その次に難しい将棋がここ2~3年で勝てるようになってきました。昨年(2015年)に情報処理学会が事実上の勝利宣言を出していますので、将棋の場合、コンピューターが人間に勝ったのは2015年です。それに対して、囲碁はかなり難しいので、人間に勝てるようになるのは大体将棋の10年遅れと言われていたのです。ところが、それがあっという間に勝ってしまったということで、かなりの驚きでした。
もともとは今年の1月に『Nature』に論文が載りまして、このディープマインドの「アルファ碁」がヨーロッパのチャンピオン、つまりプロ棋士に勝ったという内容のものが出たのです。それはそれですごいことなのですが、ただ、その方はプロですが2段だったため、トップのプロ棋士よりはだいぶ差があるということで、トップと対戦すると勝てないのではないか、というのが大方の見方でした。ですから、囲碁に詳しい方でも人工知能の研究者でも、李世ドルさんが5勝0敗か4勝1敗で勝つだろうと言っていたのです。それがふたを開けてみれば、コンピューター側が4勝で、人間側が辛くも1勝したということで、かなり衝撃的な出来事でした。
●人間と人工知能の戦略にはずれがある
非常に印象的だったのは、「アルファ碁」が打つ序盤の手がどうも悪い手のように見えることです。解説者も「これは間違えましたね」などと言うのですが、それが中盤・終盤になってくると、うまい具合につながってきて結果的に見るといい手だったということになるのです。要するに、大局観で人間を上回ってしまっているわけです。こういうことがかなり起こっているため、解説者もだんだん解説ができなくなってきて、自分が理解できない手でも、「これは悪い手だ」と言えなくなるのです。実はいい手なのかもしれないわけですから。
いくつか面白いことがあります。例えば、昔はやっていた「昭和の手」と言われているようなものを、実は「アルファ碁」は多用していたり、人間が定石だと思っていたものが実はそれほど良くなかったりしているのです。囲碁の空間の中で人間が長い年月をかけていろいろといい戦略を探索してきたわけですけれども、それと最適な戦略は、実は若干距離があるようだということが分かって、すごく面白いことだなと思います。
●アルファ碁勝利の要因は「ディープラーニング」
なぜこんなに急に、人工知能が囲碁で人間に勝てるようになったのかというと、その一番の大きな要因は、「ディープラーニング」を使ったことです。ディープラーニングとは、詳細は前回のシリーズ講話の中でご説明したので省きますけれども、大ざっぱに言ってしまうと「認識ができる技術だ」ということです。特に画像の認識などができるようになるということです。
囲碁の場合、盤面が非常に画像的なのです。白と黒で構成されていて、石も動かないので、非常に画像的で、ここにまさにディープラーニングの画像認識でよく使われるコンボリューショナル・ニューラルネットワーク(畳み込みニューラルネットワークという)を使ったというわけです。
●まず高次元の特徴量を得る
どのようにやるかというと、囲碁の升目は「19×19」ですが、これを19×19ではなく、「19×19×48」で認識するのです。どういうことかというと、一つの目に対して48個の特徴量(特徴を数式化したもの)をまず定義するのです。白が置かれているか、黒が置かれているか、あるいはアタリ(※注:囲碁用語のこと。相手の石を完全に囲んで取る一歩手前の状態を指す)かとか、いろいろなことで48種類の特徴量で定義します。つまり、ローデータ(生データ)としては「19×19×48」なのです。これに対して、13段のコンボリューショナル・ニューラルネットワーク、つまり13階層のディープラーニングのニューラルネットワークを適用すると、非常に高い次元の特徴量が得られるのです。「この辺がアツい」とか「この辺が弱い」といった特徴量が得られるということです。
●「まね」と「自己対戦」で徹底学習
それに対して...