写真●SX-ACEの外観
写真●SX-ACEの外観
[画像のクリックで拡大表示]

 NECは2013年11月15日、ベクトル型スーパーコンピュータの新機種「SX-ACE」(写真)を発表、同日販売を開始した。メモリーコントローラーやI/Oコントローラーを内蔵した新開発のマルチコアCPUを使ってノード構成を簡素化した。ノード間は分散メモリー型で並列処理となる。従来機種「SX-9」(2007年10月販売)と比べて、同一性能当たり10分の1の消費電力および5分の1の設置面積を実現した。価格(5%税込み)は、レンタル月額で450万円から。

 ベクトル型スーパーコンピュータの最新機種である。一般に、ベクトル型のスーパーコンピュータは専用に設計されており、汎用のハードウエア部品を流用するスカラー型と比べると高価になる。この一方で、単一のコンピュータとして動作するノード当たりの性能はスカラー型よりも高く、並列処理でなくても計算能力を確保しやすい。また、処理性能当たりのメモリー転送速度が高く、大容量データを一括処理する用途に向く。

 SX-ACEは、従来機種のSX-9(関連記事:NECが3年ぶりにベクトル型スーパーコン新機種「SX-9」を販売)と比べて、ハードウエアアーキテクチャーを簡素化し、1個のマルチコアCPU(4コア、メモリーコントローラーなどを内蔵)を1ノードとした。1ノードは、4コアCPU×1個とメインメモリー64Gバイトを搭載したCPU/メモリーボードである。ノード同士はメインメモリーを共有せず、アプリケーションを複数ノードで動かす場合は分散メモリー型となる。「MPIを使った並列処理が主流なので分散メモリー型にした」(NEC)。

 主な仕様は以下の通り。ベクトル演算性能は、CPU(ノード)当たり256G FLOPS(コア当たり64G FLOPS)。メインメモリーの転送速度は、CPU(ノード)当たり256Gバイト/秒(コアあたり64Gバイト/秒)。このため、処理性能当たりのメモリー転送速度は、1演算当たり1バイト。1ラック当たり、最大で64ノード(64枚のCPU/メモリーボード)を搭載する(最大構成は8ラック分で512ノード)。ノード間の接続方式は2段のFat-Treeで、ノード間の最大通信速度は、ノードあたり8Gバイト/秒×2(双方向)。

表●SX-ACEとSX-9の比較
機種名SX-ACESX-9
CPU当たりのコア数41
ノード当たりのCPU数116
CPU当たりの処理性能256G FLOPS102.4G FLOPS
CPU当たりのメモリー転送速度256Gバイト/秒
CPU当たりのメモリー容量64Gバイト
ノード当たりの処理性能256G FLOPS1.6T FLOPS
ノード当たりのメモリー転送速度256Gバイト/秒4Tバイト/秒
ノード当たりのメモリー容量64Gバイト1Tバイト
シングルノードのメモリーアーキテクチャー共有メモリー
マルチノードのメモリーアーキテクチャー分散メモリー共有・分散メモリー
ノード当たりのノード間通信速度8Gバイト/秒×2128Gバイト/秒×2