◆イセドル九段に勝ったアルファ碁に、和製AIはどう出るか?

「ニコニコ動画」を運営するドワンゴによると、日本棋院の趙治勲名誉名人(60)が、今月囲碁ソフト「ディープゼンゴ(DeepZenGo」」と互先で、3局対戦すると発表した。「DeepZenGo(ディープゼンゴ)プロジェクト」のこれまでの歩みを、ベスト新書『アルファ碁はなぜ人間に勝てたのか(斉藤康己著)』より紹介する。

◆人間を打ち負かしたアルファ碁の衝撃から半年

 日本の囲碁プログラマ達は、アルファ碁の大成功を前にして、大きなショックを受け、一瞬たじろいだと思います。しかし、ゼンという日本では最強の部類のプログラムを育ててきた加藤英樹と尾島陽児のDeep ゼンチームなど、即座に「1年以内にはアルファ碁を負かせるぞー!」と宣言した人たちもいて、まだまだ興味深い戦いが続きそうです。

 

 アルファ碁と同じモンテカルロ木探索の手法を使って最近どんどん強くなっているプログラムにゼン(Zen)があります。このプログラムを作っているゼン開発チームの代表である加藤英樹が、それぞれの途中局面に対するゼンの評価値(プログラム側の勝率を%で表したもので、プログラムが常に計算しています。)を参考として示してくれるのですが、プロ棋士にとってはその数値が自分たちの感覚とは食い違っていて、どうもしっくりこない様子。プロ同士の対戦では対戦後、感想戦というのが行われることも多く、そこで、この局面ではこう考えていたとか、ここよりもこちらが大きいと思っていたとか、お互いの着手の意図や思考過程を話しあいます。

 この手が悪かった、あの手が良かったといろいろと議論して対戦の総括もできるのですが、アルファ碁は、なかなか一手一手まで踏み込んだ意図や判断理由の説明ができないようです。これはパラメータ学習という機械学習の手法を使ったプログラムの大きな特徴、あるいは欠点かもしれません。

◆これまでのゼンの戦歴

 これまでは、日本の中でプロ棋士と囲碁プログラムの対局が行われる場合でもハンディキャップなしの互先はなく、三子か四子(ハンディキャップの大きさで、先手の黒が、黒石を3個または4個置いた状態から試合を始めること)を置いて囲碁プログラム側がハンデをもらって対局するのが常識でした。3月23日、アルファ碁とイ・セドル九段の対局のすぐ後で行われた第4回電聖戦(囲碁プログラム同士の対局の後、その優勝、準優勝プログラムと日本のプロ棋士との間での対局が毎年行われる定期戦)でも、小林光一名誉棋聖と日本では一番強いゼンとダークフォレスト(フェイスブック社のAI研究所が開発している囲碁プログラム)の間の対戦は三子局でした。この戦いではゼンは勝ち、ダークフォレストは中押しで負けました。

 しかし、すでにアルファ碁と似た手法を採用している多くの囲碁プログラマたちは、最初にトップクラスのプロ棋士に勝つという名誉はグーグルのディープマインド社に奪われたものの、1年以内にはプロに互先で勝つと案外鼻息が荒いのです。

 日本のゼンチームがドワンゴの資金援助を得てアルファ碁への宣戦布告をしたのは、まだアルファ碁とイ・セドル九段の対戦が行われる前の3月1日でした。

 しかし、将棋のように、プロとの対決は終わりを告げ、あとはプログラム同士の戦いで最強のプログラムを決めることしか残っていないと考えるのは早計でしょう。もっと多くのプロ棋士との対戦を重ね、プログラム側の弱みが明らかになってくるかもしれません。

 あるいは、そんな可能性は微塵もなく、あっという間に人間のレベルを超えた神の領域にプログラムが突入してしまうのでしょうか?

<ベスト新書『アルファ碁はなぜ人間に勝てたのか(斉藤康己著)』より抜粋>