中国のスーパーコンピュータ開発が加速している。現行世界2位のスパコンが、2017年中に演算能力を2倍に高めた新鋭機に刷新される見通し。中国は複数のCPUやアクセラレータ(演算加速器)を並行して開発し、中核技術を米国に依存しないスパコンで1エクサFLOPS(1秒当たり浮動小数点演算回数)級の実現1番乗りを目指す。
天河2号後継機の詳細が明らかに
2013年6月から2015年11月まで世界のスパコン演算性能ランキング「TOP500」で首位をキープしていた中国のスパコン「天河二号」の後継機「天河二号A(Tianhe-2A)」の詳細が2017年9月末に明らかになった。米テネシー大学のジャック・ドンガラ教授が公開したレポートによれば、独自開発のアクセラレータ(演算加速器)を搭載することで現行の2倍の演算性能を実現できるという。既にシステムの25%は完成し、2017年11月までにはフル稼働する見込みだ。天河二号Aは、引き続き中国国防科学技術大学(NUDT)が開発する。
スパコン用アクセラレータは現在、米エヌビディアのGPU(グラフィックス処理プロセッサ)「Tesla」シリーズが市場シェアの過半を占めている。2017年後半から最新のVolta世代GPU「Tesla V100」の出荷が始まっており、2017年11月に発表予定のTOP500のほか、省電力ランキング「Green500」でも上位に登場しそうだ。米インテルのアクセラレータ「Xeon Phi」シリーズが市場シェアでTeslaに続く。
ただしこれらのアクセラレータは、核開発への応用を懸念する米政府による輸出規制のため、中国でスパコン用に大量調達するのは困難になっている。そこで中国NUDTは、天河二号が採用していた「Xeon Phi Knights Corner」を、独自開発のアクセラレータ「Matrix(邁創)-2000」で置き換えた。
Matrix-2000は、汎用GPUならぬ「汎用DSP(general purpose data signal processing)」をうたうチップ。128個の演算コアを1.2GHzで並列動作させる。Intel Xeonプロセッサ2個、Matrix-2000を2個で構成するノードを1万7792台用意することで、理論演算性能94.97ペタFLOPSを実現する。
TOP500の指標となるLinpackベンチマークでの実行効率(理論演算性能に対する実行演算性能の比)は63.98%と一般のGPUスパコン並みである一方、メモリーを多く使うHPCGベンチマークの実行効率は0.365%で、一般的なスパコンの数分の1~10分の1ほどと低い。チップの性能を引き出すアプリケーションのプログラミング難度は高そうだ。
ただ中国では、HPCGベンチマークが同水準の0.3%である「神威・太湖之光(Sunway TaihuLight)」で、大量のメモリーを使う気象予測アプリケーションを稼働させた実績がある。実行効率の低さをソフトウエア開発力でカバーできる可能性もある。