ニュース

Googleが考える近未来モバイル端末のメモリアーキテクチャ

~国際メモリワークショップ(IMW)2017レポート

国際メモリワークショップ(IMW 2017)の参加登録者 ※5月17日夕方のクロージングリマークスから

 半導体メモリ技術の研究開発に関する国際学会「国際メモリワークショップ (2017 IEEE 9th International Memory Workshop: IMW 2017)」が、米国カリフォルニア州モントレーで2017年5月14日~17日(現地時間)の日程で開催された。最終日である17日の夕方に設けられた閉会式(クロージングリマークス)では、参加登録者の人数と来年(2018年)の日程などが明らかにされた。

 メインイベントであるテクニカルカンファレンス(15日~17日)の参加登録者は、約250名。地域別では米国からの参加者が60%と最も多く、アジアからが28%、欧州からが11%だった。アフリカからも1%未満ながら、参加者があった。プレイベントであるショートコース(14日)の参加登録者は、135名だった。ショートコースの参加者はほぼすべてテクニカルカンファレンスに参加するとみられるので、カンファレンスの参加者の半分強(54%)がショートコースにも参加したことになる。ショートコースが別料金であることを考慮すると、この比率はかなり高い。

来年のIMWは日本の京都で5月中旬に開催へ

 来年(2018年)の国際メモリワークショップ(IMW)は、5月13日~16日の日程で開催される予定となった。開催予定地は日本の京都である。IMWは2009年が第1回で、開催地は今年と同じモントレーだった。筆者の知る限りでは、IMWが日本で開催されるのは初めてである。日本開催となると、アジアの参加者が増えそうだ。

来年(2018年)の国際メモリワークショップ(IMW)の開催予定概要 ※5月17日夕方のクロージングリマークスから

カメラと人工知能でユーザーの周囲状況を認識

 話題をテクニカルカンファレンスに移そう。15日の基調講演セッションでは、Googleが近未来のモバイル端末(スマートフォンやウエアラブルデバイスなど)を想定したメモリアーキテクチャについてスピーチした。講演タイトルは「Driving innovation in memory architecture of consumer hardware with digital photography and machine intelligence use cases」、講演者はEric Shiu氏(コンシューマハードウェア担当)である。

 講演で述べた近未来のモバイル端末とは、どのようなものか。現在のスマートフォンにおけるユーザーインターフェイスの主力は、タッチパネルとソフトウェアキーボード、音声入力となっている。これに対して近未来のモバイル端末では、カメラと人工知能(「マシンインテリジェンス(Machine Intelligence)」と呼称)の組み合わせによってユーザーの周囲の状況を画像で認識するとともに、音声出力を活用してユーザーをサポートする。

 例えばユーザーがモバイル端末に音声入力で問いかけると、モバイル端末は周囲の状況の認識と推論によって回答を導出する。回答は音声出力でユーザーに教えたり、ディスプレイ画面にテキストとグラフィックスで表示したりする。

 このようなモバイル端末の画像認識に関わるハードウェアは、カメラ(CMOSイメージセンサーとデジタルデータ出力)、画像信号処理回路(固定機能)、CPU(カメラ制御)、メモリ(DRAM)で構成されるとする。ユーザー(モバイル端末)の周囲に誰が存在しているか、ユーザーの周囲で何が起こっているか、などを認識する。

 画像撮影のプレビューモードではフルフォーカスの画像をリアルタイムにディスプレイ表示したり、ビデオ録画モードでは高能率符号化回路をリアルタイムに動かしたりする。また音声認識に関しては、ユーザー周囲の音を拾って認識し、会話(言語)や音楽などに区分けする。

カメラで撮影した画像の処理に関わるハードウェアの構成例 ※IMW 2017の発表論文から

カスタムDRAMとSoCを近接して配置

 こういったハードウェアを構成するメモリに求められるのは、高速なアクセスと低い消費エネルギーの両立である。しかし実際には、超高速と超低消費を両立させたメモリは存在せず、階層化された複数種類のメモリが併存する状況となっている。

 そこでGoogleでは、メモリサブシステムに関するいくつかの研究を外部機関と連携しながら、進めている。講演ではその一部を示していた。

 例えば、アプリケーションプロセッサのSoC(AP SoC)チップとカスタムDRAMチップを同一のパッケージ内に近接して配置することで、DRAMデータの入出力に要する消費電力を低く抑える試みがある。パッケージングにFOWLP (Fan-Out Wafer LevelPackaging)技術を導入した。電源電圧1.14VでDRAMのデータを2,666Mbpsの速度で読み出し、GB/s当たりの消費電力を20mWに抑えたという。

DRAM(IPM)チップとAP SoCチップを近接して搭載したパッケージ基板の配線レイアウト ※IMW 2017の発表論文から

DRAMをトランザクションレベルで制御

 また、DRAMを従来のコマンドレベルではなく、トランザクションレベルに命令の抽象度を上げてページ単位でデータを一括して扱えるようにすることで、遅延時間(レイテンシ)を短縮するとともに、消費電力を削減するアーキテクチャを示した。

 シミュレーションではデータを4KBのページ単位で扱うと、遅延時間が10分の1に短くなるとともに、消費電力が58分の1と極めて低くなるという。このアーキテクチャを「スマートメモリ(Smart Memory)」、あるいは「コンピュートニアメモリ(CNM: Compute Near Memory)」と呼んでいる。

スマートメモリのアーキテクチャ。「init」や「move」などのトランザクションレベルのコマンドをDRAMが扱えるようにする ※IMW 2017の発表論文から

バイトアクセス可能な不揮発性メモリを活用

 ウエアラブルデバイスやIoT (Internet of Things)端末などの超小型モバイル端末向けには、バイト単位でアクセス可能な不揮発性メモリをストレージ兼メモリとして活用する。不揮発性メモリの活用によって、ダイナミックな消費電力を可能な限り、低く抑える。

 具体的には、オンチップキャッシュを内蔵するAP CPUと、バイト単位でアクセス可能な不揮発性メモリを、LPDDR系インターフェイスを介して接続する。そして両者をFOWLP技術によって同じパッケージに封止する。不揮発性メモリの候補には、3D Xpointメモリ、相変化メモリ(PCRAM)、抵抗変化メモリ(ReRAM)、磁気メモリ(MRAM)が考えられる。

 不揮発性メモリの活用は、DRAMのリフレッシュ電流に相当するダイナミックな消費電力を省くことで、バッテリの寿命(充電間隔)を延ばすことに寄与する。ここで問題となるのは不揮発性メモリの書き換え寿命である。ZRAM技術といったデータ圧縮技術を導入してキャッシュの記憶容量を実効的に増やすことが、書き換え寿命の問題を緩和するとしていた。

 また不揮発性メモリをメモリ兼ストレージにすると、不適切なアクセスによって記憶内容を改ざんしたり、記憶内容を盗んだりされるリスクが大きくなる。このため、暗号化といった対策が必要になるとする。

ウエアラブルデバイスやIoT (Internet of Things)端末などの超小型モバイル端末に向けたメモリアーキテクチャ。PCRAMは不揮発性メモリの一例として挙げた ※IMW 2017の発表論文から

ソニーのDRAM内蔵CMOSイメージセンサーを高く評価

 このほか講演では、2017年2月に国際学会ISSCCでソニーグループが発表した、カスタムDRAMを内蔵したCMOSイメージセンサー技術を高く評価していた。

 この技術はイメージセンサのシリコンダイと1GbitカスタムDRAMのシリコンダイ、画像信号処理回路シリコンダイを積層したもので、カスタムDRAMは512bitの入出力バスを装備して、102Gbpsの高速データ転送を可能にしている。カスタムDRAMの搭載によって高速ビデオ撮影でも出力インターフェイスがボトルネックとなる恐れが減り、撮影画像の品質が著しく向上する。

従来のCMOSイメージセンサ技術(左)とソニーグループが開発したCMOSイメージセンサー技術(右) ※ソニーグループがISSCC 2017で発表した資料から
ソニーグループが開発したCMOSイメージセンサー技術のブロック図。カスタムDRAMは撮影画像データのバッファとして働く。イメージセンサーの画素数は20Mピクセル ※ソニーグループがISSCC 2017で発表した資料から

 Googleの半導体メモリに対する主張は明確で、一言でまとめると「特定用途向けに仕様をカスタマイズしたメモリが欲しい」である。

 これに対して半導体メモリのサプライヤは「数量ありき」の論理が支配的であり、「一定数量を超えた購入数」が見込めないと、特定用途向けメモリの開発には踏み込めない。特にDRAMメーカーは「数量ありき」の傾向が強い。

 このため、IntelやAppleなどの影響力の大きな企業が強く働きかけないと、特定用途向けの仕様は実現しにくい。Googleがモバイル端末のハードウェアに関する影響力をどこまで発揮できるかが、特定用途向けメモリの具現化を左右するだろう。