ニュース

AlphaGoを追うドワンゴ/東大の囲碁AI「DeepZenGo」がプロ棋士と対局

~ディープラーニング導入で飛躍的に棋力向上

左から、ドワンゴ会長の川上量生氏、Zen開発代表の加藤英樹氏、趙治勲名誉名人、日本棋院 副理事長の山城宏氏、日本棋院 理事長の團宏明氏、東京大学大学院 松尾研究室 研究員の関根正之氏

 株式会社ドワンゴは9日、ディープラーニングを利用した囲碁ソフト「DeepZenGoプロジェクト」に関する記者発表会を東京の日本棋院市ヶ谷本院にて開催した。

 DeepZenGoプロジェクトは、今年(2016年)の3月にドワンゴが日本棋院の協力のもと、囲碁ソフト「Zen」の開発者である尾島陽児氏と加藤英樹氏らを中心として発足したもので、Google傘下のDeepMindが開発した人工知能の「AlphaGo」が世界的棋士のイ・セドル九段との対局で勝利し耳目を集めた中、その結果を踏まえ、新生囲碁ソフトの完成を目指して立ち上げられた。

 プロジェクトメンバーには上述のZen開発者のほかに、人工知能の研究で有名な東京大学大学院 特任准教授の松尾豊氏とその研究室研究員、将棋ソフトPONANZAの開発者である山本一成氏が参加しており、ドワンゴは開発環境や開発支援を行なっている。

 今回の発表会ではDeepZenGoプロジェクトの進捗と成果が報告され、新たなプロ棋士と対戦する第2回 囲碁電脳戦も発表された。

 まず開会とともにPONANZAの山本一成氏がプロジェクトから外れることが伝えられた。これは同氏が製作している将棋プログラムの製作などと折り合いが付かなくなったためで、今後はいろいろな形で応援できればとのメッセージを残した。

 会場には、日本棋院 理事長の團宏明氏、同副理事長の山城宏氏、Zen開発代表の加藤英樹氏、東京大学大学院 松尾研究室 研究員の関根正之氏、そしてドワンゴ会長の川上量生氏が登壇。プロジェクト発足から8カ月を経て、DeepZenGoについて報告するに足る成果が出せたとのことで、今回発表を行なう運びとなった。

AlphaGoの手法を取り入れつつ独自性を持ったZen

 DeepZenGoプロジェクトではそれぞれが役割を持って活動しており、ドワンゴは開発環境の提供を、日本棋院は棋譜などのデータの提供や対局する棋士の斡旋などを行なう。東京大学の松尾研究室は、理論的なサポートとして囲碁ソフトの論文研究をしており、何をすれば強くなるか、有望ならそのモデルを作るといったことを行なっている。

 一方、Zenの開発者側は、尾島氏が本体を作成しており、主にニューラルネットワークの学習、プログラムの修正や調整を行ない、加藤氏自身はニューラルネットワークの計算部分、アルゴリズム、GPUで走らせるためのプログラムを書いている。

 現在は有利な手を判断する「ポリシーネットワーク」に取りかかっており、だんだん強くなり実行速度も上がっているとのこと。そしてポリシーネットワークを使って、局面を評価するバリューネットワークの学習も行なっている。加藤氏いわく、DeepZenGoはAlphaGoの手法であるバリューネットワーク、ポリシーネットワーク、モンテカルロ木探索を使いながらも、尾島氏の考え方が色濃く反映されており、AlphaGoを真似するのではなく、あくまでZenを強くする方針で作り込んでいるという。そのため、細部にかなりの違いが出ているそうだ。

DeepZenGoプロジェクトにおけるそれぞれの役割

半年間で昨年10月時点のAlphaGoと並ぶディープラーニングの効果

 加藤氏はDeepZenGoの強さについて、9月の時点で棋力を図るKGSレーティングのランクで7dから10dへと一気に昇段しており、Eloレーティングに関しては半年前のv11.4で2,400ほどだったレーティングが、9月時のv12.4で3,000まで上がっているという。なお、AlphaGoは中国のプロ棋士であるファン・フイと昨年(2015年)10月に対決した段階ではEloレーティングが3,000だったとのこと。

KGSレーティング
Eloレーティング
プロ棋士とのレーティングの比較

 これについて東京大学の関根氏も、開始時から明らかに短期間で強くなっており、ディープラーニングの成果が現われているとした。しかしまだまだやってみたいことがあるとのことで、DeepZenGoは開発の途上だという。

 同プロジェクトは、DeepZenGoがプロ棋士のレーティングに近付いたとのことで、一定の成果が出たと判断。今回の発表に至った。ちなみに現在のAlphaGoのレーティングは3,600ほどとのことで、日本人棋士の井山裕太氏などと同じクラスにいる状態だという。ドワンゴの川上氏は、DeepZenGoがイ・セドルと戦った今年3月時点のAlphaGoの強さに到達するのも時間の問題だろうとした。

趙治勲名誉名人との3番勝負が決定

 前述の通り、ディープラーニングを組み込んだDeepZenGoがプロ棋士と戦えるレベルに達したとの判断から、今回日本棋院所属の趙治勲(ちょう・ちくん)名誉名人との対戦も合わせて発表。途中から趙氏も登壇した。

 趙氏は史上最多の74タイトル獲得、棋聖・名人・本因坊の3大タイトル独占などで知られ、このほかにも七大タイトル製は、本因坊10連覇などの輝かしい戦歴を誇る日本囲碁界トップ棋士の1人と言われている。

 対局は11月19日、20日、23日の三番勝負で実施され、ニコニコ生放送で「第2回囲碁電脳戦」として放映される。

 この対局について、Zen開発者の加藤氏は「3番勝負ということでもうちょっと番所が欲しい。少ないと3連敗など偏ってしまう可能性もある。あと残り10日間、できる限りのことをする。一番嬉しいのは趙氏と対戦できること。昨年の電脳線で趙との対局を叶わずそれが心残りだった。趙氏にZenは10年早いと言われていたとのことなので、今回趙氏をけちょんけちょんにして恩返ししたい」と述べた。

 一方の趙氏はそんな形の恩返しは結構です、と冗談を返しつつZenの打ち方に対して、「打ち方は人間的で布石感覚が上手。自分たちは感覚でやるが、Zenは力学的である。序盤の方に学ぶところが多く、そこに人工知能らしさを感じる。人間と打つのが飽きてきたので対局が楽しみである。もし勝ったらもう一度挑戦を受ける。負けたら帰る」などと会場の笑いを誘いつつ、プロ棋士らしい着眼点でZenについて語った。

趙治勲名誉名人のプロフィール
ルール
持ち時間
解説・聞き手・立会人
11月20日から開催

 対局におけるDeepZenGoのスペックは下記の通りで、クラスタ接続などは行なわれない。

  • CPU: Xeon E5-2699v4×2(44コア、2.2GHz)
  • GPU: TITAN X(Pascal世代)×4
  • ストレージ: SSD 128GB(システム)、SSD 480GB×2
  • メモリ: 128GB
Zen開発者の加藤英樹氏と握手する趙治勲名誉名人