ニュース

3千CPUで数カ月かかる計算が0.1秒で完了。汎用原子レベルシミュレータ「Matlantis」

～PFNとENEOSがクラウドサービスで提供開始

森山和道

2021年7月7日 06:50

　株式会社Preferred Networks(PFN)とENEOS株式会社(ENEOS)は7月6日、共同出資により6月1日に設立した新会社Preferred Computational Chemistry(PFCC、プリファード・コンピュテーショナル・ケミストリー)から、共同開発した新物質開発・材料探索を高速化する汎用原子レベルシミュレータ「Matlantis(マトランティス)」をクラウドサービスとして提供開始したと発表した。契約ユーザー向けに提供する。

　PFNとENEOSは2019年度から協業し、AI技術を活用したマテリアルズ・インフォマティクス分野での革新的事業創出を検討してきた。共同設立の新会社PFCCが提供するMatlantisは、第一原理計算(原子スケール)で材料の挙動を再現するデータセットを作り、それをもとに大規模な材料探索を行なう汎用原子レベルシミュレータ。従来の物理シミュレータにディープラーニング(深層学習)モデルを組み込むことで、計算スピードを従来の数万倍に高速化し、領域を限定しない様々な物質への適用を可能にした。

　ディープラーニングモデルの訓練には、PFNのスーパーコンピュータを使って物理シミュレーションした膨大な量の原子構造データを使用。マテリアルズ・インフォマティクスのコアツールとして提供する。開発した材料のIPは利用ユーザーが持つ。

　Matlantisでは、未知の材料を含む分子や結晶などといった任意の原子の組み合わせのシミュレーションが可能。現在は55の元素をサポートしており、今後さらに拡大予定。従来のDFT(Density Functional Theory : 密度汎関数法)では数時間〜数カ月かかった原子レベルの物理シミュレーションを数秒単位で実施できる。

　学習済みディープラーニングモデル・物性計算ライブラリ・高性能な計算環境をパッケージにして提供することで、ユーザーはハードウェアの準備や環境構築をすることなく、すぐにWebブラウザ上でシミュレーションによる材料探索が可能となる。

ディープラーニングとシミュレータの組み合わせ。PFNのスパコンで大規模データセットを作成

PFN代表取締役最高執行責任者、PFCC代表取締役岡野原大輔氏

　同日開催されたオンライン会見では、マシンラーニング(機械学習)やディープラーニングなどの情報科学を用いて材料探索をおこなうマテリアルズ・インフォマティクスの最新状況や、ユーザー事例などが紹介された。

　まず初めにPFN代表取締役最高執行責任者でPFCC代表取締役の岡野原大輔氏が、PFCC立ち上げの経緯やMatlantisの特徴などを紹介した。PFNは2014年に創業し、2017年には化学・生物分野向けのライブラリを公開。2019年からは石油生成プロセスの効率化などで研究開発を行なうENEOSと資本・事業提携をして、触媒開発や表面の反応など現場の課題をディープラーニングで解決するべく取り組んできた。今回のシミュレータMatlantis開発はその成果。

　PFNは事業の要として、これまでもAIとシミュレータの掛け合わせに取り組んでいる。Matlantisはこれまでの取り組みの中でも「最大規模かつ最もインパクトの大きいもの」と岡野原氏は語った。MatlantisではAIでシミュレータを強化することに成功した。具体的には既存のシミュレータの結果を学習データとして使い、ニューラルネットワークを学習させ、シミュレーションデータを内挿能力を使って入力から予測できるようにする。今回はこのアプローチを原子レベルシミュレータに応用した。

PFNはAIとシミュレーションの組み合わせに注力

　Matlantisは3つの特徴がある。その1つは高速性。従来のシミュレータと同程度の精度でありながら、10万倍から1,000万倍の高速処理ができる。「従来は2カ月かかっていたシミュレーションを0.3秒で行なうことができる」という。

　また、現時点で55の元素の組み合わせに対応しており、任意の組み合わせでもシミュレーションができる汎用性の高いシミュレータとなっている。こうした特徴により、これまで扱いにくかった大規模で複雑なシミュレーションを実現できる。これまでに既に、再生エネルギー向け合成燃料用触媒、電池、潤滑油などの開発に必要なシミュレーションに成功しているという。

　さらに、Webブラウザを立ち上げれば誰でも使える。ハードウェアの準備や環境構築は必要なく、エンジニアや研究者がすぐに使うことができる。

Matlantisは高速性・汎用性に優れ、既にシミュレーションの成功例も

　特に今回は、PFNの持つスパコンがフルに生かされている。高い汎用性を持つシミュレータの実現のためには、膨大な量の、非常に広い範囲の入力について学習しておく必要がある。そのためのデータセットはPFNのスパコンを使って作られた。1台のGPUなら273年間かかる計算時間を費やして、データセットを作成した。

　岡野原氏は「これは材料探索のみならずAI全体を見ても非常に大規模。これまでに類を見ない大規模な計算インフラを使ってデータセットを作っている」と述べた。これに「世界最高レベルのAI技術を使って学習させることで高速性と汎用性を実現した」という。

1台のGPUなら273年間かかる計算時間を費やしてデータセットを作成

　材料はこれまでも新生活、新産業を切り開いてきた。窒素固定による農業革命、鉄や炭素繊維による自動車や飛行機の実現、半導体による計算機の実現などだ。現在は持続可能な社会の実現のために、これまでにない革新的な素材が求められている。

　PFCCは、新たな素材開発を加速するマテリアルズ・インフォマティクス技術を活用した革新的なサービスを提供することにより、持続可能な開発目標(SDGs : Sustainable Development Goals)の目標9「産業と技術革新の基盤をつくろう」のゴールである「強靱なインフラ構築、包摂的かつ持続可能な産業化の促進およびイノベーションの推進を図る」ことを始めとした、目標の達成に貢献していく。

第一原理計算をベースにした新しいマテリアルズ・インフォマティクス

PFCC取締役、ENEOS株式会社執行役員中央技術研究所長藤山優一郎氏

　PFCC取締役で、ENEOS株式会社執行役員中央技術研究所長の藤山優一郎氏は、データサイエンスを材料開発に応用したマテリアルズ・インフォマティクス(MI、Materials Informatics)の概要と、その中でのMatlantisの位置付けや目標について紹介した。

　MIとは、材料開発にAIを用いて膨大な候補物質から有望材料を見出す技術である。2011年に米国がプロジェクトを立ち上げたことをきっかけに大きく発展している。従来は材料科学者が実験を繰り返したり、分子シミュレーションを使って「こういった分子を作れば、おそらくこんな物性になるだろう」と予測を行なってきた。だがこれでは非常に時間がかかる。

　それに対してMIは、過去に積み上げられた実験データやシミュレーションデータをAIに読ませて、分子の構造と物性の相関を調べる。その相関が分かれば何かしらの分子が材料になった時の物性が分かるはずだ。これができれば大きなインパクトがある技術なので、各国の企業で研究が進んでいる。

マテリアルズ・インフォマティクスの現状

　しかし、やってみるとそう簡単ではないことも分かってきている。スタートラインは文献の実験データだ。これをデータベース化してマシンラーニングで材料の化学構造と物性の関係を学習させる。モデルができれば、化学構造を入れてやると物性が出てくるというものになるはずだ。

　特徴としては、理屈が分からなくてもシミュレータが作れること。課題は、学習外の物質の予測が困難であること。また、広範囲の膨大なデータが必要なのだが、実験データを集めることが難しい。加えて、文献では失敗事例は入手が難しい。そのため一般的なMIは難しい。

　それに対してMatlantisは、スタートラインが違う。量子力学を用いたエネルギー計算である「第一原理計算」がベースにある。たくさんの原子配列に対してエネルギーを計算し、その大量のデータをもとにAIを学習させる。最終的な学習モデルは原子配列を入れると、ほとんど瞬時にエネルギーが計算できて物性が出てくるものになる。

　こちらの特徴は、理論に基づくので未知の物質に対しても非常に高い予測性を持つこと。藤山氏は「非常に汎用性が高い。使ってみて我々自身も驚いている。まだ学習させていないような原子、新しい分子の性質も意外と当てることができる」と述べた。

　課題は、教師データ作成には専門知識とコンピュータリソースが必要であること。この2つをPFNとENEOSが解決した。計算リソースについてはPFNのスパコンが、膨大な探索空間における教師データの配置や、具体的にどこの部分を用意すると有効かといったノウハウについては、ENEOSの強みが生かされた。

　また、Matlantisは高速性を利用して擬似的に逆問題を解ける。MIの場合は、化学構造から物性を予想する。だが材料開発は、まずは「こういう性質のものが欲しい」ところから始まる。そのためにどういう化学構造を作ればいいのかを予測することが、材料開発の逆問題だ。Matlantisの場合は高速で結果が出るので、原子配列を大量に用意でき、その中から一番いい物性、欲しい物性のものを力技で探し出せてしまう。

Matlantisと一般的なMIの比較

　実験化学者にとってリアルな実験は重要だがコストがかかる。できるだけたくさんやりたいがその余地がない。そのため、Matlantisでバーチャル実験をやる。多くの候補からよいものをより出して、リアル実験で確かめることができるようになる。

　藤山氏は「研究開発のサイクルを変えるものになるのではないかと考えている」と語った。すでにENEOSの事業範囲である触媒、潤滑油、吸着剤に適用したところ、非常に良い、「驚くような結果」が得られているという。

　藤山氏は最後に「非常に汎用性が高い。我々も使うが世界中の方に使ってもらいたい。革新的マテリアルの創出に貢献したい。世の中が変わるに従って必要な材料の創出を世界中で加速したい」と語った。

研究開発を変えるものになり得るという

材料科学とディープラーニングを融合。現実世界を原子から計算可能に

PFNリサーチャー高本聡氏

　PFNリサーチャーの高本聡氏は、Matlantisを構成する技術の概要を解説した。コア技術はディープラーニングとシミュレーションの融合。特に原子の動きをニューラルネットワークで表現する「ニューラルネットワーク・ポテンシャル」という技術が中心で、材料の性質を原子のスケールで解明することができる。材料の世界は広く、人類はまだ一部しか活用してない。そこで計算機に頼った材料開発が待望されてきた。ディープラーニングはそれを大きく加速するという。

現実世界を原子から計算可能にする

　原子の実在が受け入れられたのは20世紀初頭。世の中の物質は個性のない物質の集まりでできていることが分かった。言い方を変えると、究極的には原子の組み合わせを再現できれば世の中のあらゆるものの性質を予言することができることを意味している。

　だが原理が分かったあと、現実世界の物質を扱えるようになるまでには長い時間がかかった。原子の振る舞いは量子力学に基づいており複雑なためだ。密度汎関数理論(DFT)が成立するにはさらに半世紀が必要だった。

　そして計算機によってシミュレーションが可能になったものの、量子化学計算は計算の限界があり、対象は限られていた。より効率的なモデルが求められていたが人間の力には限界があった。ここがディープラーニングが期待されている理由だ。ディープラーニングによって機械が持つことのできる表現力は大幅に増加した。

　Matlantisのニューラルネットワーク・ポテンシャルを同社では「PFP」と呼んでいる。PFPの技術特徴はユニバーサル、汎用的であることだという。通常のシミュレータは知られた材料の組み合わせを対象として開発される。だが材料探索のためには未知の材料に対してもシミュレータが破綻しない必要がある。

　実世界では長らく一般物体認識が難しいとされていたが、ディープラーニングによって性能が向上し、一気にアプリケーションが広がった。同じことが原子の世界にもあてはまる。このための要素技術は2点。

　1つはディープラーニングモデルの発展。ディープラーニングをグラフ構造に対して適用する「グラフ・ニューラルネットワーク」という技術が発展した。原子の繋がりもネットワーク構造とみなすことで、このネットワークで扱うことができる。

　一方物理の世界では、原子のふるまいは結合角度や高次な幾何学的構造で表現されている。こういった要素は最近のニューラルネットワークでは積極的に取り込まれている。高本氏は「物理モデルをニューラルネットワーク化していく、あるいはニューラルネットワークに物理モデルを取り込んでいく。こういったかたちで両者は互いに溶け込みつつある」と語った。PFNでは両者の専門知識を活用して独自のアーキテクチャを構築しつつある。

　もう1つはデータセット。汎用性が高いことを目標として構築した。データセットは物理シミュレーションを使うことでデータを増やしていける。PFNとENEOSの技術者で議論し、よりチャレンジングな方向に課題を再定義し、原子構造をどう生成してどう動かせば課題が達成できるか、試行錯誤を繰り返しながら大規模データセットを構築したという。

ディープラーニングモデルと大規模データセットで汎用性を実現

Matlantisの3つの特徴

　Matlantisは前述のように3つの特徴を持つ。汎用性と高速性とすぐにWebブラウザで使えることだ。高本氏はMatlantisを実際に使う様子を動画で紹介した。

　Matlantisでは柔軟な材料シミュレーションのためにプログラミング環境を提供する。ニューラルネットワークポテンシャルはAPIとして提供される。これによりユーザーはGPUなどを意識することなく材料探索にフォーカスできる。プログラミング環境はインタラクティブで、素早い試行錯誤ループを回すことができる。

　ニューラルネットワークポテンシャルの提供だけでない。シミュレーションは要素技術を作り込む方向と、要素技術を組み合わせていく2方向のモチベーションがあるが、「これらの抽象度の階段を上り下りできることが大事」と考えているという。

　Matlantisでは材料探索ライブラリ「Matlantis features」を提供し、使用例も同梱する。また物性値計算のような原子シミュレーションの要素技術もパッケージ化し、組み合わせられる。これにより、計算材料科学の専門家とほかの各専門家をシームレスに繋げ、プラットフォームとして用いることができるという。

実際のMatlantisの利用画面

数カ月間必要だった計算が0.1秒で終了

信州大学先鋭材料研究所教授古山通久氏

　信州大学先鋭材料研究所教授の古山通久氏はMatlantisの実際の活用事例を紹介した。同グループでは合金ナノ粒子触媒について研究を行なっている。

　近年、ナノ粒子の中に存在している原子1粒1粒が見えるようになっている。観察された像をコンピュータで再構築し、そのまま量子力学計算でどのような物性になるのかを計算できれば、ナノ粒子触媒の本質に迫る知見が得られる。

　しかし、量子力学の計算は、原子数が増えれば増えるほど大変になり、通常は数十原子で計算する。そのため、ナノ粒子を構成する数百～数千原子の計算には大型スパコンが必要になる。古山氏らは2014年から世界の中でもリードできる研究を展開してきた。

金属ナノ粒子の計算

多元素化すると探索空間が膨大に

　合金触媒は複数種類の金属の合金による触媒だ。多くの触媒は単一だが、別の金属を加えると異なる性質になる。近年は5種類以上の元素を混合した「ハイエントロピー合金」が研究されるようになっている。多元素化すると組み合わせが爆発し、60くらいの金属原子から5つを選ぶと800万通りにもなる。組成の選び方や合成条件、反応条件などによりさらに組み合わせは増えるため、実験的にも計算的にも、膨大な探索空間の効率的な探索方法が必要になっている。

　古山氏らはMatlantis β版を使って、自動車排ガス浄化触媒や、燃料電池電極触媒材料の探索を行なった。自動車排ガス触媒ではロジウムという元素が注目されている。1g10万円を超えることもある高価な金属だからだ。そのためロジウム代替の触媒が探索されている。古山氏らはロジウムを第3元素として加えるアプローチで材料の探索を行なっている。量子力学計算とMatlantisの結果を比較すると、非常に高い精度で計算できそうな感触を得たという。

　また、自動車用の燃料電池電極触媒を模擬した構造、酸化物の上に白金が乗った界面構造をシミュレーションした。「これまでに量子力学計算で2,000～3,000CPUを使って、数カ月間でようやく数個の計算が得られる。Matlatisを使うとこれがわずか0.1秒で終了する。驚きとともに期待をしている」と語った。

従来手法では数カ月かかった計算が0.1秒で終了

新材料の探索に活用

　実際にどう活用していくのかについては、安定・高活性な候補物質をサイバー空間で探索し、ハイスループットの合成装置でそれを検証する。古山氏は「候補物質の選定の中で、Matlantisと、ほかのマシンラーニングの仕組みとを組み合わせて、次々に新しい材料を生み出していきたい」と語った。

「わくわくする以外の要素がない」

革新的なマテリアル創出を目指す

　質疑応答では多くの質問があがった。海外でも同種の取り組みが昨今始まっているが、実際に10万GPUを使って大規模なデータセットを作ったことや、汎化性能の高いニューラルネットワークを選び、化学に適用するノウハウなどが他グループとの違いで、「1年くらいのアドバンテージはある。このアドバンテージをいかしてやっていきたい」(藤山氏)とのことだった。扱う元素数も今後順次増やしていき性能を上げていく。また、利用形態は企業向けやアカデミック向けなど様々なものを用意しているという。

　岡野原氏は「1つ1つ実績を積み重ねていく。実績が増えればそこから育っていくと思う。プラットフォームからスタートしても成功しない。まずは破壊的な製品サービスを作って価値を認めてもらう。その上でプラットフォームを考えていく順番でないと成功しない。Matlantisもそのように考えている」と語った。

　またENEOSの藤山氏は「精度からすれば100%の結果を得る必要はない。数万の候補の中から10個、20個の候補を絞れれば材料探索側からすれば高速スクリーニングができる。実験の一歩手前までもっていければいい」と述べた。

　古山氏は「20年近く計算化学の世界にいるが、触った感じは圧倒的に汎用性が高い。これまで全くできなかったことができるようになるのが強みなんじゃないか。数カ月かかっていた計算が1秒もかからないで終わる。わくわくする以外の要素がない。十分に合理的な精度が実現されている。アカデミアの立場からも協力していきたい」と述べた。