エラー訂正可能なメモリーが主流

写真1●エラー訂正可能なサーバー向けメモリー・モジュールの外観
誤り訂正用の符号データを格納するメモリーチップを搭載する。このモジュールはチップセットとメモリーチップ間のバッファ用コントローラも載っている。コントローラのレジスタを介することから「Registered」と呼ばれる。
写真2●PCサーバーの放熱設計の例
筐体前面に吸気口を設けて,筐体背面の排気ファンによって空気の流れを作り出すのが一般的。写真は日本ヒューレット・パッカードの「hp server tc2120」。
写真3●ネジを使わずに取り外せる「PowerEdge 600SC」の排気ファン
障害発生時の部品交換を効率よく進められるように配慮してある。取り外しレバーを引き上げるだけでファンを取り外せる。

 メーカーがi845Eをサーバーに使える理由は,「サーバーには必須」と考えるECC(Error Check and Correct)に対応しているからだ。ECCはランダムに発生するメモリーのエラーを訂正する機能である。例えば宇宙から降り注ぐ放射線がメモリーに衝突することによって,ごくまれに書き込んだはずのデータが失われてしまうことがある。「ECCが無ければ,データが化けたことが分からないでそのままになる可能性がある」(NECの柴氏)。

 ECC対応のチップセットは,メモリーにデータを書き込む際,CPUの処理結果だけでなく,誤り訂正用の符号データを付加してメモリーに書き込む。読み出す際は読み出すデータとそれに対応する符号データを照らし合わせて,データが変化した場合に符号データを基にデータを復元する。

 もちろん,符号を追加するためそのままでは容量が減ってしまう。そのためECC対応のメモリーでは,ECCに使う符号データ分のメモリーチップが追加されている(写真1[拡大表示])。ECCの符号の長さは,低価格PCサーバーでは64ビット分のデータにつき8ビット。256Mビット容量のECC対応メモリーではチップを9枚搭載する。

熱設計に余裕のある筐体

 チップセットと並ぶ低価格PCサーバーの特徴が筐体である。一般にPCサーバーの筐体は,(1)高温環境下で高負荷をかけた状態での連続稼働に耐えられる熱設計,(2)ハードディスクや空冷ファンといった部品故障時のメンテナンス性の2点に注意が払われている。

 まず,(1)の熱設計では,10万円を切る価格帯のPCサーバーの多くがタワー型の筐体を採用している。デスクトップ・パソコンよりも筐体が大きい点で放熱能力に余裕がある。筐体が大きいほど,筐体内で熱を拡散するための容積と,吸排気用の開口部の面積を稼げるからだ。その面積を生かして,外気を吸気する際の空気抵抗を減らすために筐体の前面にスペースの許す限り開口部を設けている(写真2[拡大表示])。いずれの製品も発熱量の多いハードディスクを冷却しながら,Pentium 4ベースのCPUが発した熱を筐体外に排出する。

 逆に言えば,現状ではラックマウント型の低価格PCサーバーは実現が難しい。10万円を切るラックマウント型はロジカルイフェクトの「Caplyst 1U」程度である。低価格PCサーバーの最小構成では,Pentium 4コアを搭載するCeleron 1.7G~1.8GHzが主流である。Pentium 4との差別化の意味で,動作周波数が2GHz未満のCeleronは現行Pentium 4のコア(Northwoodコア)ではなく,1世代前のPentium 4コア(Willametteコア)になる。Northwoodコアの製造プロセスが1.3μmであるのに対して,Willametteコアは1.8μm。Celeron 1.7GHzの場合,熱設計に際しての最大発熱量の目安となる熱設計電力(TDP:Thermal Design Power)は63.5Wに上る。ちなみにPentium IIIベースCeleronだとTDPは1.4GHzで34.8W。この発熱量の差が原因で「ラックマウント型でもPentium IIIを冷却可能な筐体は電源と冷却ファンを含めて70~80ドルのコストで済む。Pentium 4だとその3倍近いコストがかかる」(プロサイド 技能開発研究所商品企画Groupの手塚清孝サブマネージャー)。ラックマウント型では筐体に開口部を設ける面積が少ないうえに筐体内のほとんどを部品が占めてしまうため,小型の冷却ファンを複数個使う必要があるからだ。

泣き所は空冷ファンの故障

 熱設計に余裕がある筐体とはいえ,冷却ファンが一つでも停止すればサーバーは停止してしまう。冷却ファンを複数備えることで冗長性を持たせる上位機と違い,低価格PCサーバーでは故障したファンを交換しなくてはならない。故障した部品を交換する際のメンテナンス性がサーバーの停止時間を左右する。そのため,低価格PCサーバーの可用性は,故障した空冷ファンをどれだけ素早く交換できるかにかかっている。

 低価格PCサーバーに限った話ではないが,なるべくドライバーやレンチなどの工具を使わずに部品を挿抜できるように工夫してある(写真3[拡大表示])。サーバーの場合は保守員による出張修理(オンサイト保守)が付属することがほとんどのため,ユーザーが自ら中を空けて部材を交換するのはまれだ。とはいえ,出張修理の場合でもメンテナンス性の良さがダウンタイムの短縮に効いてくる。オンサイト保守契約終了後や障害の内容によってはユーザー自らがメーカーから送られてきた保守部品を交換する場合があることを考慮すると,簡単に部品を交換できる工夫は欠かせない。

故障監視ソフトは上位機と同じ

 ここまで見て分かるように,耐障害性で上位機に劣る低価格PCサーバーの方が,動作状態に注意を払わなければならない。先に述べたように,低価格PCサーバーでは空冷ファンが一つ壊れただけでマシン全体の故障につながるからだ。そのため,上位機と同じくネットワーク経由でハードウェアの状態を監視するツールを添付するメーカーが多い。例えばNECと日本IBM,デルコンピュータは,上位機と同じ管理ツールを添付している。複数台のサーバーをネットワーク経由で一括監視できるのが特徴だ。日本ヒューレット・パッカードのtc2120は旧コンパックコンピュータ製の「ProLiant」シリーズとは製品ラインが違うため,複数台のサーバーを一括監視するソフトではなく,スタンドアロンの監視ツールのみを添付する。

 もっとも低価格PCサーバー特有の事情として,サーバー室への設置が前提の上位機と違い,低価格PCサーバーはオフィスの片隅や机の脇に設置される場面が少なくない(別掲記事「オフィスに置く場面を考慮」参照)。人の居るフロアに設置する場合は,ハードウェア故障の警告音で障害に気付くことがある。

写真●人のいるオフィスに設置した際の誤操作を防ぐフタ
写真は日本IBMの「xSeries 205」。

オフィスに置く場面を考慮

 低価格PCサーバーはパソコンと同じ感覚で設置される場面が少なくない。パソコンよりは大きめの筐体とはいえ,上位機に比べると設置面積は小さい。オフィスの角や机の下に置くにはちょうどよいサイズだ。

 こうした人の行き交うオフィスに設置した場合のトラブルを防ぐ役割を果たしている機能がある。筐体の前面にあるフタによるスイッチ類の保護機能だ。「膝が当たってCD-ROMが出てしまったことでトラブルを引き起こしたケースが過去にあった」(日本IBM IAサーバー&PWS事業部製品企画の北原祐司担当)というような誤操作をスイッチ類を覆うフタで防ぐ。

 低価格PCサーバーの中では,日本IBMのxSeries 205やプロサイドのProside SV 1130BDEが筐体の前面にフタを備えている(写真)。フタを閉じてしまえば,電源スイッチやリセット・スイッチ,増設したテープドライブの取り出しボタンに誤って触れてしまうことはない。