中国のスーパーコンピュータ開発が加速している。現行世界2位のスパコンが、2017年中に演算能力を2倍に高めた新鋭機に刷新される見通し。中国は複数のCPUやアクセラレータ(演算加速器)を並行して開発し、中核技術を米国に依存しないスパコンで1エクサFLOPS(1秒当たり浮動小数点演算回数)級の実現1番乗りを目指す。

天河2号後継機の詳細が明らかに

 2013年6月から2015年11月まで世界のスパコン演算性能ランキング「TOP500」で首位をキープしていた中国のスパコン「天河二号」の後継機「天河二号A(Tianhe-2A)」の詳細が2017年9月末に明らかになった。米テネシー大学のジャック・ドンガラ教授が公開したレポートによれば、独自開発のアクセラレータ(演算加速器)を搭載することで現行の2倍の演算性能を実現できるという。既にシステムの25%は完成し、2017年11月までにはフル稼働する見込みだ。天河二号Aは、引き続き中国国防科学技術大学(NUDT)が開発する。

中国が独自開発するアクセラレータ「Matrix-2000」の外観
中国が独自開発するアクセラレータ「Matrix-2000」の外観
(出所:米テネシー大学)
[画像のクリックで拡大表示]

 スパコン用アクセラレータは現在、米エヌビディアのGPU(グラフィックス処理プロセッサ)「Tesla」シリーズが市場シェアの過半を占めている。2017年後半から最新のVolta世代GPU「Tesla V100」の出荷が始まっており、2017年11月に発表予定のTOP500のほか、省電力ランキング「Green500」でも上位に登場しそうだ。米インテルのアクセラレータ「Xeon Phi」シリーズが市場シェアでTeslaに続く。

 ただしこれらのアクセラレータは、核開発への応用を懸念する米政府による輸出規制のため、中国でスパコン用に大量調達するのは困難になっている。そこで中国NUDTは、天河二号が採用していた「Xeon Phi Knights Corner」を、独自開発のアクセラレータ「Matrix(邁創)-2000」で置き換えた。

 Matrix-2000は、汎用GPUならぬ「汎用DSP(general purpose data signal processing)」をうたうチップ。128個の演算コアを1.2GHzで並列動作させる。Intel Xeonプロセッサ2個、Matrix-2000を2個で構成するノードを1万7792台用意することで、理論演算性能94.97ペタFLOPSを実現する。

*1つのコアはスカラー演算部に加えて256ビットのベクトル演算回路を2つを備え、1サイクルで64ビットの倍精度浮動小数点演算を最大16回実行できる。1チップ当たりの理論演算性能は128コア×16×1.2GHz=2.4576テラFLOPSで、従来のXeon Phiの2倍以上となる。

 TOP500の指標となるLinpackベンチマークでの実行効率(理論演算性能に対する実行演算性能の比)は63.98%と一般のGPUスパコン並みである一方、メモリーを多く使うHPCGベンチマークの実行効率は0.365%で、一般的なスパコンの数分の1~10分の1ほどと低い。チップの性能を引き出すアプリケーションのプログラミング難度は高そうだ。

 ただ中国では、HPCGベンチマークが同水準の0.3%である「神威・太湖之光(Sunway TaihuLight)」で、大量のメモリーを使う気象予測アプリケーションを稼働させた実績がある。実行効率の低さをソフトウエア開発力でカバーできる可能性もある。