ニュース
中国・兆芯のx86互換8コアSoC「開先KX-5000」の全貌
2018年1月31日 12:22
上海兆芯集成電路有限公司は2017年12月28日に発表会を開き、最新のx86互換SoC「開先KX-5000」シリーズを正式発表した。発表後、兆芯に対して発表会の資料を要請したのだがなかなか届かず、1月後半になってようやく同社サイト上でその模様が公開された。本記事ではサイト上で公開された情報をもとに、KX-5000シリーズの全容をお伝えする。
旧世代からIPCを25%向上
発表会では、エンジニアの王惟林氏がKX-5000シリーズを解説した。開先KX-5000シリーズは11月9日にテープアウトが発表されたが、今回の正式発表ではSKUも明らかとなった。スライドよれば、KX-5640、KX-5540、KX-U5680、KX-U5580、KX-U5580Mの5モデルの存在する。
また、サーバー向けに、最大対応メモリ容量を128GBに拡大し、ECCやRegistered DIMMをサポートする一方で、GPUを省いた「開勝KH-20000」の存在も明らかにされ、「KH-26800」と「KH-25800」の2つの型番のものが用意されることが明らかとなった。
同社の製品情報によると、各モデルの仕様は下記のとおりとなっている。共通で言えることは、いずれも動作クロックが2GHz留まりであり、高クロックで性能を追求した製品ではないことだ。KH-20000シリーズの掲載は省いているが、基本的にKH-26800はKX-U5680、KH-25800はKX-U5580からGPUを省き、上記のメモリ周りの機能を追加した製品である。
モデル | KX-U5680 | KX-U5580 | KX-U5580M | KX-5640 | KX-5540 |
---|---|---|---|---|---|
プロセスルール | 28nm | ||||
パッケージ | HFCBGA 37.5×37.5mm | ||||
クロック | 2GHz | 1.8GHz | 1.8GHz以下 | 2GHz | 1.8GHz |
コア数 | 8 | 4 | |||
Adaptive Overcloking | なし | あり | なし | ||
共有L2キャッシュ | 4MB×2 | 4MB | |||
対応命令 | x86/x64/SSE 4.2/AVX/TXT/NXbit | ||||
暗号化 | ACE/SHA-1/SHA-256/SM3/SM4/乱数発生 | ||||
バス | FSB | ||||
APIC対応 | あり | ||||
温度保護 | 対応 | ||||
C-States(C1-C4) | 対応 | ||||
P-State | 対応 | ||||
GPU対応API | DirectX 11.1 | ||||
ハードウェアデコード | 対応 | ||||
最大解像度 | 4K | ||||
最大ディスプレイ出力 | 3基 |
いずれもCPUコアを内包したSoCであり、CPUのほかにGPUやPCI Expressバス、DDR4対応メモリコントローラを内蔵している。PCI Expressは3.0対応で、最多で24チャネルに対応し、最大で9スロット供給できる。
ただし、内蔵されているGPUについてはまだまだ謎が多い。DirectX 11.1対応と4K出力以外の特徴はわかっておらず、アーキテクチャなども非公開だ。兆芯はVIAから技術ライセンスの提供を受けてCPUを開発しているため、GPUに関してはS3 Graphicsの流れを汲む可能性もあるが、はっきりとしたことは言えない。
いわゆるサウスブリッジとして、新たに「ZX-200」を用意している。SoCとはPCI Express 3.0 x4で接続。9チャネルのPCI Express 2.0バスを備えるほか、2ポートのUSB 3.1(Type-C対応)、3ポートのUSB 3.0、そして6ポートUSB 2.0を備える。チップセットとしてのUSB 3.1へのネイティブ対応はAMD X370/B350チップセットに続くもので、Intelより先行している。また、4基のSATA 6Gbpsも備える。
Core i3-6100相当の性能を謳う
KX-5000シリーズのマイクロアーキテクチャの開発コードネームは「WuDaoKou」である。2013年8月より開発がスタートし、アーキテクチャを新規設計。パイプライン、メモリアクセスのバンド幅、分岐予測、投機実行などの機構を再設計または大幅な改善を施し、IPCは従来製品(ZX-C)から25%向上した。加えて、多コア化により1チップあたりの性能は140%、DDR4のサポートによりメモリバンド幅は120%向上した。
中国国内の第三者機関による、KX-5000の8コアモデルのベンチマークでは、メモリバンド幅はSTREAM 1C COPYが12GB/s、STREAM 8C COPYが17GB/s、SPECint2006のスコアは19.9、SPECint_rate2006のスコアは115だった。また、中国の大手PC専門メディア「微型計算機」によるテストでは、FrizChessのスコアは7,911、7-zipの総合スコアは12,112MIPS、CINEBENCH R11.5のCPUレンダリングスコアは4.01ptsであり、これはCore i3-6100に相当する性能だという。
ただ今回提示されたベンチマークはいずれもマルチスレッドに特化したものである。KX-5000が8コアであることを踏まえると、1コアあたりの性能は2コア/4スレッドのCore i3-6100と比較してかなり低いと言わざる得ない。
ただ、従来のZX-C+は4コアネイティブ設計であり、8コアのSKUは4コアのダイを1つのパッケージに封入した方式を採用していた。ダイ間のキャッシュのコヒーレンシはマザーボード上のノースブリッジを経由する必要があったため、レイテンシが問題となっていた。KX-5000シリーズは1チップに集約され、コア間のコヒーレンシはポイントツーポイントのクロスバースイッチとなったため、レイテンシが削減している。
チックタックビジネスモデルで今後はKX-6000とKX-7000も
発表会では、KX-5000シリーズの開発過程も公開された。開発は2013年8月よりスタートし、2014年6月にアーキテクチャの設計が完成、2015年7月に基本設計が完成したという。その後、2016年4月にハードウェアの設計を完成させ、2016年8月に露光用のマスクをテープアウト。2016年10月に動作検証を行ない、2017年10月に量産開始した。
開発は累計9,000カ月にもおよぶ開発時間を費やした。4,000個の計算コアが使用され、開発データは200TBにもおよぶ。また、10台のハードウェアエミュレータおよび検証プラットフォームが投入され、1,500億にのぼる命令の組み合わせをエミュレーション、300種類を超えるソフトウェアのテストなどが行なわれ、CPU、GPU、メモリコントローラ、PCI Expressバスに対して包括的な性能/機能/信頼性/エージングテストが実施された。
また、Windows Hardware Quality Labs(WHQL)の認証も取得しており、Windows 7/10/10神州網信政府版、中科方徳、中標麒麟、普華といったOSのサポートも実現した。
現在、兆芯はIntelが(かつて)採用しているチックタックモデルでCPUを開発しており、次期の「LuJiaZui」こと「KX-6000」シリーズは16nmへのシュリンクを行ない、動作クロックを3GHzまで引き上げる。さらにその次期となる「KX-7000」でマイクロアーキテクチャを刷新し、DDR5メモリやPCI Express 4.0への対応を果たすとしている。
ちなみに、同社の開発コードネームは中国の地名に由来する。ZX-CおよびZX-C+世代は「ZhangJiang」(張江)と呼ばれるが、これは上海の浦東新区にあるハイテクパークの名称で、兆芯本社のすぐ近くだ。KX-5000世代のWuDaoKou(五道口)は北京市海淀区にあるに駅の名前で、いわば中国の秋葉原こと“中関村”近辺。KX-6000世代のLuJiaZui(陸家嘴)はまた上海の浦東新区に戻り、浦東でもっとも栄えている地域だ。
中国産x86 CPUと中国産OSの難しさ
発表会では、中国国内でCPUやOSを独自開発する難しさも指摘された。中国でCPU開発がスタートしたのは比較的最近のことであり、世界で活躍するIntelやARMと比較して設計能力が不足している。
また、IntelはすでにCPUを開発するノウハウが蓄積されており、MicrosoftといったOS開発メーカー、DellやHPといったPCメーカーと良質なエコシステムを築いているが、中国国内はその状況までほど遠い。
とくに、CPUの開発コストの高さについても指摘されている。Armに関してはIP設計とライセンスがメインで、半導体は製造していないため比較的低コストで開発できる。直近5年のCPU開発への投資は毎年平均で約2億4,380万ポンド(約375億円)だ。Intelの研究開発費は平均で毎年約114億ドル(約1兆2,435億円)、AMDはその10分の1の規模となっている。IBMとAppleはIntelとAMDのあいだの中規模で、Huawei傘下のHiSiliconもCPU開発の投資を拡大しており、いまやIntelに匹敵する規模となっていることが紹介された。
一方でアーキテクチャ別の開発研究費を見ると、x86は1つのアーキテクチャを設計するのにおおむね30億ドルかかっており、ArmやPowerアーキテクチャと比較して高いことがわかっている。もっとも、兆芯自らの研究開発費は発表会で語られていないため、規模は不明だが、30億ドル規模の投資がないとx86 CPUの開発は難しい、ということだ。
OSの開発については、純粋に人材不足と資金不足を挙げた。Microsoftは10万人規模の社員を抱えているが、中国のOS開発会社は大規模なところでも300~500人規模。ハードウェア製造メーカーとのエコシステムも構築されておらず、資金も不足している。Windows Vistaの開発費用は200億ドル規模で、アポロ計画に匹敵するレベルなのだが、中国国内でそこまで大規模な資金を研究開発に費やせるOS開発企業はなく、依然として開発レベルに差が存在するとした。