写真1 日立が東大に納入するPCクラスタ型スパコンの同型機
写真1 日立が東大に納入するPCクラスタ型スパコンの同型機
[画像のクリックで拡大表示]
写真2 日立側の開発責任者である深川部長
写真2 日立側の開発責任者である深川部長
[画像のクリックで拡大表示]
写真3 発生する熱を外部に逃がすため、プロセサを互い違いに配置した
写真3 発生する熱を外部に逃がすため、プロセサを互い違いに配置した
[画像のクリックで拡大表示]

 日立製作所は東京大学から受注したPCクラスタ型のスーパーコンピュータを本誌に公開した。08年3月までに製造を完了して納入。同年6月に本格稼働する予定となっている。このスパコンは東大、筑波大、京都大の3大学で策定した共通仕様で導入するもの。各大学の頭文字から「T2K」とも呼ばれる。

 東大が導入するのは、日立のPCサーバー「HA8000-tc/RS425」(写真1)。プロセサは米AMDのクアッドコア型「Opteron」で、1個に4コアを内蔵している。PCサーバーの1ノード当たり4個のOpteronを搭載しており、全952ノードで3808個、1万5232コアの構成となる。理論性能値は最大140テラFLOPSで、稼働予定の08年6月時点で国内最高速となる見通しだ。現在の国内トップは東京工業大学の「TSUBAME」で、56.4テラFLOPSである。

 性能向上にともない、やはり難しくなってきたのが熱設計だ。

 日立側の開発責任者であるエンタープライズサーバ事業部第一サーバ本部クラスタシステム部の深川正一部長は「Opteronもクアッドコアとなって熱設計が難しくなった」と語る(写真2)。HA8000-tc/RS425は、周辺部品などもあわせると1ノード当たりの消費電力はおよそ1キロ・ワット。「常にドライヤーを強で利用している」(深川部長)ほどの熱がサーバーの内部で発生する。

 そこでボード上のプロセサの配置を工夫した。4つのOpteronをマザーボード上に互い違いで配置(写真3)。プロセサを冷やすファンの風が、それぞれのプロセサとヒート・シンクに当たりやすくした。ファンは4個×2列の計8個の部品で構成するが、1個が壊れても動作に問題がない設計としている。このほかヒートシンクの素材は、熱伝導率が高く冷却効果を高められる銅を採用した(一般的なサーバーではアルミニウムを利用する)。

 2つめの難関が信頼性の確保だ。極めて大規模なPCクラスタ型では、故障率が高いとメンテナンスに追われることとなる。そこで、「コンデンサーなどの部品は故障率がより低い高品質なものを選んだ。そこまで必要かと言われるほどだった」(深川部長)という。故障の“予兆”をキャッチする仕組みも充実させた。温度や電圧、ファンの回転数などを測定するセンサーを1ノード当たり約100個搭載した。これは一般的な複数プロセサのサーバーの3倍程度だという。
 
 最後の難関がクアッドコアOpteronの調達だった。3800個もの数が必要となる一方で、メーカー側の製造歩留まりの悪さなどから大量に確保するのが難しい状況だったからだ。そこで、深川部長はAMDの米本社に出向いて、必要な数の確保を直談判したという。

 東大は歴史的に日立のスパコンを導入している。このため業界では「今回も日立で決まりだろう」と言われていた。これに対して深川部長は「特に今回はコモディティの製品を組み合わせたPCクラスタ型。外資も含めてすべてのベンダーが採用される可能性があった。部品の発注も開札で最終決定となる12月25日までストップをかけていた」と明かす。

 日立は1月上旬から、同社の豊川工場で生産に入っている。台湾などのベンダーから納入されたモジュールを組み立てて調整する。日立は「HA8000-tc/RS425」を東大に納入するほか、まずは国内で販売していく。