森山和道の「ヒトと機械の境界面」

スパコン「京」を使う「次世代生命体統合シミュレーション」とは



 6月24日、独立行政法人理化学研究所(理研)は、スーパーコンピュータ「京(けい、10の16乗を意味する)」に向けた「ライフサイエンスのグランドチャレンジプロジェクト 次世代生命体統合シミュレーションソフトウェアの研究開発」の進展と展望に関する説明会を報道関係者向けに行なった。その内容をレポートする。

 スーパーコンピュータ「京」は、文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムのもと、理研と富士通株式会社が共同開発中のスパコンである。6月20日に第26回国際スーパーコンピューティング会議ISC'11で発表された第37回TOP500リストで世界第1位を獲得したばかりだ。現在、2012年の共用開始を目指して整備段階にあり、先頃のTOP500では672筐体(CPU数68,544個)構成でのLINPACKベンチマークで8.162PFLOPS(毎秒8,162兆回の浮動小数点演算数)、理論性能に対する実行効率は93.0%を達成した。

 10PFLOPS級(1秒間に1京回)を目指すスパコン「京」。ハードウェア的にはスカラ型CPUを採用した超並列分散メモリ型スパコンで、CPUは8個のプロセッサコアによるマルチコア構成で消費電力で優れる「SPARC64 VIIIfx」。富士通フォーラムなどで展示されているのを見たことがある読者も多いと思う。これを8万個使っている。CPU同士の通信ネットワークは「Tofu」と呼ぶ独自の6次元メッシュ/トーラス構成による直接結合ネットワークをとっており、通信が衝突しないように工夫されているほか、代替経路を備えており、故障に強く運用性に優れているとされている。

 では、この「京」は何に使われるのか。原子レベルでのシミュレーションを半導体デバイス全体で行なうことや、地震や津波、雨雲や台風の動きをより細かくシミュレーションすることなどが目標に掲げられている。これまでのシステムでは解くことができなかった大規模問題を解くこと、技術の継続的な蓄積が「京」開発の目的だ。

 用途の1つがライフサイエンスへのペタスケール・シミュレーションの導入である。理研の次世代スーパーコンピュータ開発本部副本部長で、次世代生命科学統合シミュレーション研究開発プログラムのプログラムディレクターである茅幸二氏は「ペタスケールのシミュレーション技術でライフサイエンスの定量的解明にブレークスルーを起こしたい」と述べた。ビル&メリンダ・ゲイツ財団による医薬品開発など海外の動向についても触れて「海外に負けないためにも我々のソフトウェア開発は重要な位置を占めている」と語った。

開発中のスーパーコンピュータ「京」 CPU 8万個で10PFLOPSを目指す 8.162PFLOPSで世界最速になった
コンピュータの進歩の歴史。「京」は右上 神戸にある理研計算科学研究機構。モニュメントは計算機の原点である「そろばん」 次世代生命科学統合シミュレーション研究開発プログラム プログラムディレクター 茅幸二氏
次世代計算科学プロジェクト副プログラムディレクター 姫野龍太郎氏

 次世代計算科学プロジェクト副プログラムディレクターの姫野龍太郎氏は、生命現象を超多体系多階層問題として紹介した。小さい原子/分子からタンパク質やDNA、細胞、臓器、器官、全身から構成されているからだ。Google Earthが地球全体から車1台まで見えるくらいまでズームできるように、この10の8乗から9乗の開きをシームレスにうまく埋めることが重要だという。そしてその背後にある法則に迫る「データ解析融合」をうまく調和させることで、これまでの記述する生命科学から、原理原則に基づいて予測できる生物学に変えていきたいと考えていると述べた。


超多体系多階層問題としての生命現象をシミュレーションする 生命現象シミュレーションのためには異なるスケールの研究を連結する必要がある

 まず分子スケールの研究開発としては、量子化学計算と分子動力学計算、そして粗子化モデル計算、それぞれの段階での計算を統合する技術を開発することを目指している。この技術を用いて、タンパク質あるいは細胞レベルでの機能発現の仕組みをさぐる。具体的には多剤排出トランスポーター、脂肪酸代謝酵素反応のシミュレーションを狙っている。

 「多剤排出トランスポーター」とは、最近ニュースでもしばしば取りあげられている「多剤耐性菌」の細胞膜にあるタンパク質複合体である。通常、薬は細胞壁内に入って効果を発揮して、菌を死滅させる。だが多剤耐性菌には薬剤が入っても死なない。「多剤排出トランスポーター」が、細胞に入ってきた薬を吐き出してしまうからだ。そのメカニズムの解明をしようというわけだ。

 既にある程度は分かっていて、多剤排出トランスポーターには横幅9nm(100万分の9mm)ほどの「AcrB」といわれる薬を吐き出す部分がある。「AcrB」は3つのユニットからなっている。この3つのユニットが薬剤を結合して取り込み、外へ吐き出すプロセスを、3つのユニットで順番におこしていると考えられており、粗子化モデルによるシミュレーションで再現されている。多剤排出トランスポーターは熱ゆらぎによる分子運動のエネルギーも利用しながら薬を押し出している。

 「京」ではさらに細胞膜や水分子なども考慮した全原子分子動力学計算を行ない、厳密なシミュレーションを行なう予定だ。詳細なメカニズムが解明されればトランスポーターに排出されにくい薬を開発できるかもしれない。現在ではプログラム開発は8,000並列までのテストが終わり、春から、「京」を使ったテストを行なっているという。

分子スケール研究開発 多剤排出トランスポーターのメカニズムを解明する

 細胞スケールでは、細胞の中の空間を100×100×100の100万ボクセルに分割。実証データを組み込んだ肝細胞のシミュレーションを行なう。そのプラットフォームが「RICS(Riken Integrated Cell Simulator)」というソフトウェア群だ。このシミュレータを使うと、細胞の一部分で起きている現象と細胞全体の関係が明らかにできるという。いまは赤血球や肝臓の細胞のほか、血小板、膵臓β細胞、神経細胞をターゲットにしている。

細胞スケール研究開発では100万ボクセルに細胞を分割して計算 細胞シミュレーションプラットフォーム「RICS」

 臓器全身スケールでは、血管網や臓器、全身を1mm分解能で3次元で再現したシミュレーション人体を構築することを目指す。たとえば心臓の疾患や血栓、がんなどの手術に対する支援を行なえるようにする。たとえば超音波や重イオンビームを使った手術を行なう前に、事前にちゃんと患部に焦点を結べるかなどを計算して支援する。

 当日は一例として血小板の凝集過程のマルチスケール・マルチフィジックス・シミュレーションや、心臓シミュレータが示された。血小板がたとえば血管の一部、傷がついた部分などの突起にふれると細胞表面の接着タンパク質が結合して、血小板がはりつきはじめる。そして血栓が形成されていく。

 心臓のシミュレーションは、1つ1つの心筋細胞を積み重ねて心臓を構築してシミュレーションしている。小さなタンパク質の変化でおきる病気を再現することを目指している。たとえば細胞接着分子の1つであるビンキュリンに問題があると、心筋細胞同士の接着力が低くなり、拡張型心筋症になり、心臓から拍出される血液の領が減ってしまう。今後、「京」を使って心筋細胞のなかを精密に再現することで、細胞内の小さなタンパク質の変化が、臓器や全身全体のどんな変化に繋がるのかを調べていく。

血小板の凝集過程のマルチスケール・マルチフィジックス・シミュレーション 心臓シミュレータ「UT-Heart」 超音波治療器開発のためのシミュレーションツール

 データ解析融合研究開発では、大量の実験データをうまく処理することで、関連するデータをモデルに同化することで、仮説を自動的に生成するような一連のソフトウェア開発を目指している。なお「京」を使うと、これまでのゲノムワイド解析による疾患関連遺伝子・薬剤応答遺伝子の探索にかかっていた時間を、数カ月〜数年から数十分まで短縮することができるようになるという。

 また脳神経系のシミュレーションも「京」のターゲットだ。「京」では、まだ人間の脳を再現できるほど計算能力は高くない。だが昆虫の脳や、人間の脳であっても限られた領野の限られた働きならば再現できるのではないかと考えられるため、現在はその2つをターゲットにしているという。

 これまでに開発したソフトウェアは31本。開発フェーズは3段階に分けてコントロールしている。フェーズ1、2は従来の計算機を使った開発、フェーズ3が「京」を使った開発だ。このうち開発が一番進んでいるのが「cppmd」という分子動力学計算のためのソフトウェアで、3月末の時点で1.3PFLOPS、実効効率37.2%を達成している。また16個のソフトウェアで8,000並列を達成しているという。

データ解析融合研究開発 脳神経系研究開発 カイコ蛾の神経系のシミュレーション
カイコの嗅覚から行動までのシミュレーションをロボットと統合して実行する予定 大脳皮質シミュレーション 分子動力学計算ソフトウェアcppmd

 姫野氏は理研が制作した広報ビデオの中で、「京」のことを解像度の高い顕微鏡のようなものだと例えている。これまでには見ることができなかった時間・空間解像度でシミュレーションを行なうことで、分からなかったことが明らかになってくるという。動的に変化する生命のプログラムがシミュレーションでどれだけ明らかになるのか。今後の成果に期待したい。