ニュース

中国・兆芯のx86互換8コアSoC「開先KX-5000」の全貌

KX-5000シリーズ発表会の模様(公式写真より)。これに写っているダイが唯一のダイ写真とみられる

 上海兆芯集成電路有限公司は2017年12月28日に発表会を開き、最新のx86互換SoC「開先KX-5000」シリーズを正式発表した。発表後、兆芯に対して発表会の資料を要請したのだがなかなか届かず、1月後半になってようやく同社サイト上でその模様が公開された。本記事ではサイト上で公開された情報をもとに、KX-5000シリーズの全容をお伝えする。

旧世代からIPCを25%向上

KX-5000シリーズ

 発表会では、エンジニアの王惟林氏がKX-5000シリーズを解説した。開先KX-5000シリーズは11月9日にテープアウトが発表されたが、今回の正式発表ではSKUも明らかとなった。スライドよれば、KX-5640、KX-5540、KX-U5680、KX-U5580、KX-U5580Mの5モデルの存在する。

 また、サーバー向けに、最大対応メモリ容量を128GBに拡大し、ECCやRegistered DIMMをサポートする一方で、GPUを省いた「開勝KH-20000」の存在も明らかにされ、「KH-26800」と「KH-25800」の2つの型番のものが用意されることが明らかとなった。

 同社の製品情報によると、各モデルの仕様は下記のとおりとなっている。共通で言えることは、いずれも動作クロックが2GHz留まりであり、高クロックで性能を追求した製品ではないことだ。KH-20000シリーズの掲載は省いているが、基本的にKH-26800はKX-U5680、KH-25800はKX-U5580からGPUを省き、上記のメモリ周りの機能を追加した製品である。

モデルKX-U5680KX-U5580KX-U5580MKX-5640KX-5540
プロセスルール28nm
パッケージHFCBGA 37.5×37.5mm
クロック2GHz1.8GHz1.8GHz以下2GHz1.8GHz
コア数84
Adaptive Overclokingなしありなし
共有L2キャッシュ4MB×24MB
対応命令x86/x64/SSE 4.2/AVX/TXT/NXbit
暗号化ACE/SHA-1/SHA-256/SM3/SM4/乱数発生
バスFSB
APIC対応あり
温度保護対応
C-States(C1-C4)対応
P-State対応
GPU対応APIDirectX 11.1
ハードウェアデコード対応
最大解像度4K
最大ディスプレイ出力3基

 いずれもCPUコアを内包したSoCであり、CPUのほかにGPUやPCI Expressバス、DDR4対応メモリコントローラを内蔵している。PCI Expressは3.0対応で、最多で24チャネルに対応し、最大で9スロット供給できる。

 ただし、内蔵されているGPUについてはまだまだ謎が多い。DirectX 11.1対応と4K出力以外の特徴はわかっておらず、アーキテクチャなども非公開だ。兆芯はVIAから技術ライセンスの提供を受けてCPUを開発しているため、GPUに関してはS3 Graphicsの流れを汲む可能性もあるが、はっきりとしたことは言えない。

 いわゆるサウスブリッジとして、新たに「ZX-200」を用意している。SoCとはPCI Express 3.0 x4で接続。9チャネルのPCI Express 2.0バスを備えるほか、2ポートのUSB 3.1(Type-C対応)、3ポートのUSB 3.0、そして6ポートUSB 2.0を備える。チップセットとしてのUSB 3.1へのネイティブ対応はAMD X370/B350チップセットに続くもので、Intelより先行している。また、4基のSATA 6Gbpsも備える。

KX-5000シリーズのSKUとおもな特徴
KH-20000シリーズのSKUとおもな特徴
コンパニオンチップセットとなるZX-200。ネイティブでUSB 3.1(Gen2)をサポートする
ZX-200のチップ

Core i3-6100相当の性能を謳う

 KX-5000シリーズのマイクロアーキテクチャの開発コードネームは「WuDaoKou」である。2013年8月より開発がスタートし、アーキテクチャを新規設計。パイプライン、メモリアクセスのバンド幅、分岐予測、投機実行などの機構を再設計または大幅な改善を施し、IPCは従来製品(ZX-C)から25%向上した。加えて、多コア化により1チップあたりの性能は140%、DDR4のサポートによりメモリバンド幅は120%向上した。

 中国国内の第三者機関による、KX-5000の8コアモデルのベンチマークでは、メモリバンド幅はSTREAM 1C COPYが12GB/s、STREAM 8C COPYが17GB/s、SPECint2006のスコアは19.9、SPECint_rate2006のスコアは115だった。また、中国の大手PC専門メディア「微型計算機」によるテストでは、FrizChessのスコアは7,911、7-zipの総合スコアは12,112MIPS、CINEBENCH R11.5のCPUレンダリングスコアは4.01ptsであり、これはCore i3-6100に相当する性能だという。

 ただ今回提示されたベンチマークはいずれもマルチスレッドに特化したものである。KX-5000が8コアであることを踏まえると、1コアあたりの性能は2コア/4スレッドのCore i3-6100と比較してかなり低いと言わざる得ない。

 ただ、従来のZX-C+は4コアネイティブ設計であり、8コアのSKUは4コアのダイを1つのパッケージに封入した方式を採用していた。ダイ間のキャッシュのコヒーレンシはマザーボード上のノースブリッジを経由する必要があったため、レイテンシが問題となっていた。KX-5000シリーズは1チップに集約され、コア間のコヒーレンシはポイントツーポイントのクロスバースイッチとなったため、レイテンシが削減している。

WuDaoKouアーキテクチャ。IPCが25%向上している
第三者機関によるベンチマーク結果
大手メディア「微型計算機」によるベンチマーク結果も紹介された

チックタックビジネスモデルで今後はKX-6000とKX-7000も

 発表会では、KX-5000シリーズの開発過程も公開された。開発は2013年8月よりスタートし、2014年6月にアーキテクチャの設計が完成、2015年7月に基本設計が完成したという。その後、2016年4月にハードウェアの設計を完成させ、2016年8月に露光用のマスクをテープアウト。2016年10月に動作検証を行ない、2017年10月に量産開始した。

 開発は累計9,000カ月にもおよぶ開発時間を費やした。4,000個の計算コアが使用され、開発データは200TBにもおよぶ。また、10台のハードウェアエミュレータおよび検証プラットフォームが投入され、1,500億にのぼる命令の組み合わせをエミュレーション、300種類を超えるソフトウェアのテストなどが行なわれ、CPU、GPU、メモリコントローラ、PCI Expressバスに対して包括的な性能/機能/信頼性/エージングテストが実施された。

 また、Windows Hardware Quality Labs(WHQL)の認証も取得しており、Windows 7/10/10神州網信政府版、中科方徳、中標麒麟、普華といったOSのサポートも実現した。

 現在、兆芯はIntelが(かつて)採用しているチックタックモデルでCPUを開発しており、次期の「LuJiaZui」こと「KX-6000」シリーズは16nmへのシュリンクを行ない、動作クロックを3GHzまで引き上げる。さらにその次期となる「KX-7000」でマイクロアーキテクチャを刷新し、DDR5メモリやPCI Express 4.0への対応を果たすとしている。

 ちなみに、同社の開発コードネームは中国の地名に由来する。ZX-CおよびZX-C+世代は「ZhangJiang」(張江)と呼ばれるが、これは上海の浦東新区にあるハイテクパークの名称で、兆芯本社のすぐ近くだ。KX-5000世代のWuDaoKou(五道口)は北京市海淀区にあるに駅の名前で、いわば中国の秋葉原こと“中関村”近辺。KX-6000世代のLuJiaZui(陸家嘴)はまた上海の浦東新区に戻り、浦東でもっとも栄えている地域だ。

KX-5000シリーズの開発の歴史
命令エミュレータや各種テストをクリア
チックタックの開発モデル

中国産x86 CPUと中国産OSの難しさ

 発表会では、中国国内でCPUやOSを独自開発する難しさも指摘された。中国でCPU開発がスタートしたのは比較的最近のことであり、世界で活躍するIntelやARMと比較して設計能力が不足している。

 また、IntelはすでにCPUを開発するノウハウが蓄積されており、MicrosoftといったOS開発メーカー、DellやHPといったPCメーカーと良質なエコシステムを築いているが、中国国内はその状況までほど遠い。

 とくに、CPUの開発コストの高さについても指摘されている。Armに関してはIP設計とライセンスがメインで、半導体は製造していないため比較的低コストで開発できる。直近5年のCPU開発への投資は毎年平均で約2億4,380万ポンド(約375億円)だ。Intelの研究開発費は平均で毎年約114億ドル(約1兆2,435億円)、AMDはその10分の1の規模となっている。IBMとAppleはIntelとAMDのあいだの中規模で、Huawei傘下のHiSiliconもCPU開発の投資を拡大しており、いまやIntelに匹敵する規模となっていることが紹介された。

 一方でアーキテクチャ別の開発研究費を見ると、x86は1つのアーキテクチャを設計するのにおおむね30億ドルかかっており、ArmやPowerアーキテクチャと比較して高いことがわかっている。もっとも、兆芯自らの研究開発費は発表会で語られていないため、規模は不明だが、30億ドル規模の投資がないとx86 CPUの開発は難しい、ということだ。

 OSの開発については、純粋に人材不足と資金不足を挙げた。Microsoftは10万人規模の社員を抱えているが、中国のOS開発会社は大規模なところでも300~500人規模。ハードウェア製造メーカーとのエコシステムも構築されておらず、資金も不足している。Windows Vistaの開発費用は200億ドル規模で、アポロ計画に匹敵するレベルなのだが、中国国内でそこまで大規模な資金を研究開発に費やせるOS開発企業はなく、依然として開発レベルに差が存在するとした。

CPU開発の難しさ。資金や技術面で米国/英国企業に遅れを取っている
CPUの開発コスト。設計コスト、製造コスト、テストのコストなど
他社の研究開発費。Armの単位は億ポンド、Intel/AMD/IBM/Appleの単位は億ドル、Huaweiの単位は億人民元だ
アーキテクチャごとの開発費用。x86はおおむね30~70億ドルかかり、PowerやArmと比較して高い
OS開発も資金と人材不足が指摘されている
ハードウェアメーカーとのエコシステムもWindowsやMacと比較して小規模だ
Windows Vistaの研究開発費はアポロ計画並み
OSごとの研究開発費