ニュース

IBM、誰でも簡単にAIで新材料を作れるWebアプリ

IBM Molecule Generation Experienceのトップページ

 IBMリサーチは、誰もがAIを活用して、新たな材料が発見できるWebアプリケーション「IBM Molecule Generation Experience(MolGX=モルジーエックス)」を公開した。3月4日から利用でき、英語と日本語を用意。機能を限定した体験版として無償で利用できる。

 IBMリサーチ東京基礎研究所が開発したAI技術である「分子生成モデル」の一部を活用して、AIの基本を学びながら、欲しい性質を持つ分子構造を、誰もが簡単にデザインできる体験ツールとなっている。

 IBMリサーチ東京基礎研究所マテリアル・ディスカバリー プロジェクト・リーダーの武田征士氏は、「分子生成モデルは、材料データの背後に潜むパターンを学習することで、ユーザーが望む性質を持つ分子構造を、高速にデザインし、その結果を列挙することができる。この最先端技術をIBMリサーチの研究者や、一部のデータサイエンティストだけにものに留めず、AIや科学に興味がある世界中の人たちや、社会課題の解決に貢献したいと思っている人たちに提供。

 ITスキルを身につけていなくても使ってもらいたいと考え、一部の技術を切り出して提供することにした。一般ユーザー向きに作られたわかりやすいユーザーインターフェイスや操作性により、高度なITスキルがなくても、AIの基本を学びながら、マテリアルズ・インフォマティクスの最先端を体験できる」としている。

デザイン結果を表示したところ
新たにデザインした物質をレポート

 MolGXのトップページからログイン画面に移行し、Twitter、Facebook、Googleのいずれかのアカウントでログインする。IBM IDへの対応は現時点では行なわれていない。

ログイン画面の様子

 利用方法は簡単だ。ツール内に事前準備された材料サンプルデータをもとに、そのなかからAIの学習に使用するデータを選択する「データの観察と選択」、選択したデータを使って、物質の性質を予測するようにAIモデルを学習させる「AIの学習」、水への溶けやすさや熱しやすさなど、欲しい化学的性質を持つ材料の分子形状の値を設定すると、学習したモデルをもとに、AIがそれを満たす分子構造をデザインする「分子デザイン」という3ステップを実施することで、新たな物質をデザインする。

分子デザインを行っていることろ。数10秒で完了する

 サンプルデータは、QM9とZINC15が用意されており、それ以外のデータは利用できない。正規版であれば、自社データを含めたさまざまなデータを活用可能だ。

 また、サンプルデータでは物性値の分布が一覧で確認でき、そのなかから飛びぬけた物性値を持っているものを学習セットから外したい場合にも簡単に指定ができる。AIの学習のステップにおいては、分子構造のどの部分を捉えるのかといった特徴量の設定やターゲットとする物性値設定、モデルの種類、正則化(汎化)レベルなども容易に設定できる。

 「どの設定を行なっても約10秒でAIによる学習が完了できる。短時間で学習するため、学習の精度が悪かった場合には、別の特徴量を選択したり、モデルを差し替えたり、サンプルデータを切り替えたりといった試行錯誤も可能だ」という。

 また、分子デザインでは、デザインのための条件を入力すれば、数10秒~数分で、デザインが完了し、デザイン結果を表示する。

 「融点が200℃の物質をデザインしてほしいというクエリーを投げると、学習したモデルに基づいてAIが要件を満たすような新分子の構造を列挙する。また、結果に対するルールの追加によって、最適なデザインに絞り込むことができる」という。

 その後、レポートとして、分子デザインの結果や学習に使用したデータなどが表示されるほか、デザインした分子構造を仮想の3次元空間で触って確認できる。

 さらに、2020年に公開されたIBMリサーチ チューリッヒ研究所のRoboRXと組み合わせることで、MolGXでデザインされた分子構造をもとに、合成の仕方を予測し、実験室での合成が可能になるという。

 なお、MolGXでデザインされた新たな物質の数は、同サイト上でリアルタイムに表示される。

 IBMリサーチ東京基礎研究所の福田剛志所長は、「ビジネスの拡販のために用意した体験版ではない。AIによって材料開発が加速できることを、多くの人に体感してもらい、そうした作業に慣れ親しんだ人材を作り、発見を加速する準備ができるようなコミュニティを作るという狙いもある」とした。

 また、武田氏は、「サイエンスは、誰もが参加できるものである。MolGXから、マテリアル分野のオープンイノベーションが生まれることを期待している」と述べた。

IBMリサーチ 東京基礎研究所の福田剛志所長
IBMリサーチ 東京基礎研究所 マテリアル・ディスカバリー プロジェクト・リーダーの武田征士氏

 IBMリサーチ東京基礎研究所で開発された分子生成モデルは、これまでに、ポリマーや色素材料、食品添加物などのさまざまな材料分野で活用されており、最近では半導体プロセス用の材料デザインにも使用されているという。

 「半導体を加工するさいに、微細配線パターン形成に必要なフォトレジスト内に含まれるPAG(光酸発生剤)には毒性があり、近年では環境規制の対象となっている。

 そこで、IBMリサーチでは、分子生成モデルを活用し、毒性が低く、適切な光学特性を持つPAG候補をデザインしたところ、約5時間で、約2千個の候補をデザインした。複雑な構造であるPAGでも、10秒間に1個をデザインするスピードであり、専門家が人手によってデザインするのに比べて、数10倍から数100倍のデザインスピードになっている」(武田氏)という。

 IBMでは、「Accelerated Material Discovery」として、材料発見を加速する取り組みを開始しており、科学技術レポートをはじめとした文献などからデータを抽出する「ディープサーチ」、物理化学計算を行なう「AI強化シミュレーション」、AIを用いることで新たな物質のデザインを行なう「生成モデル」、デザインした新たな物質に対して、実験プロセスを行なうロボットラボラトリである「自動実験」の4つの技術を開発。

 これらの技術は、オンプレミスやクラウド、HPC、AI、量子コンピュータなどを含むハイブリッドクラウド上で動作。これにより、新材料や新物質の発見の加速を支援しているという。

これまでデザインされた新物質の数がリアルタイムで反映される

 「あらゆる物質は、炭素原子や水素原子、窒素原子といった、分子を構成する原子の組み合わせによって構成され、性質が決まっている。だが、その組み合わせパターンは、10の60乗から100乗と言われている。サハラ砂漠の砂粒の数が10の20乗と言われている。欲しい性質の材料を発見するのは、砂漠のなかに埋もれた一粒のダイヤモンドを見つけるよりも遥かに難しい。

 これまでは、研究者の勘や経験をもとに試行錯誤をしながら、デザインし、実験を繰り返し、発見につなげてきた。このやり方では、発見するまで10年も、20年もかかり、差し迫った課題の解決には活かせない。そこでAIとデータを使って、新物質の発見を加速させていこうと考えた」(IBMリサーチの武田氏)とする。

 また、IBMでは毎年、今後5年間において、ビジネスと社会を根本的に変革すると考えるテクノロジについての予測である「5 in 5(ファイブ・イン・ファイブ)」を発表しており、2020年10月に発表した最新の5 in 5では、より持続可能な未来を実現するために、新たな材料の発見を加速することに焦点を当て、持続可能性、気候変動への対応、責任ある生産の支援、健康の増進、クリーンエネルギーの推進などの課題を取り上げている。

 福田所長は、「MolGXを使用することで、これらの課題解決につながる可能性のある新材料を、誰もがAIとともにデザインすることができる。AIを活用して、科学的に発見するという手法がトレンドとなり、材料分野にかぎらず、多くの分野で活用されることを期待している」と述べた。