米Isilon Systemsマーケティング担当シニア管理者のJay Wampold氏
米Isilon Systemsマーケティング担当シニア管理者のJay Wampold氏
[画像のクリックで拡大表示]
Isilon IQ
Isilon IQ
[画像のクリックで拡大表示]

 「大容量データに対して高速にアクセスする用途では,対称型クラスタリング構成しか適さない」---。複数のファイル・サーバー(NAS)間をインターコネクトで接続したクラスタリング構成のNASが,米Isilon Systemsの「Isilon IQ」である。2006年11月14日,同社マーケティング担当シニア管理者のJay Wampold氏に,クラスタリング技術をNASに適用する意義を聞いた。

---ファイル・サーバー間をインターコネクトで接続したクラスタリング構成で分散ファイル・システムを実現する,というアイディアは斬新だ。開発に至る経緯とターゲットとする市場を教えて欲しい。

 かつてはネットワーク・ストレージに,NAS(Network Attached Storage)とSAN(Storage Area Network)という2つの勢力が存在した。文書などの非構造化データを低速に利用するNASと,データベースなどの構造化データを高速に利用するSANとの差異である。ところが時代は流れ,ユーザー企業の需要は変化した。大容量のイメージ・データを高速にアクセスする使い方が生まれ,複数のNASを束ねて大容量と高速アクセスを両立させる形態が望まれるようになった。

 米Isilon Systemsのクラスタ・ストレージであるIsilon IQは,ノードとなるNASをサーバー間インターコネクトのInfiniBandで接続し,RAID構成としたものだ。ノードをまたがる単一の論理ファイル・システムを実現するソフトウエアとして「OneFS」と呼ぶOSを搭載する。サーバー・クラスタの考え方をNASに応用したものだ。

 複数のNASを束ねるという形態だけを見れば,米EMCや米Network Applianceも競合と言えるが,いずれも当社とは方式が異なっている。彼らはGlobal Name Space(グローバル名前空間)とファイル・システムのプロビジョニング(再配置)によってNASを仮想化する,というアプローチを採っており,従来通り,ファイルの保存先は単一のNASに固定化される。これに対して,Isilon IQでは対称型のクラスタリング・アーキテクチャを採っており,RAID接続したノード間にファイルの断片を分散配置する。

---大容量化とアクセス高速化の両立が役立つ代表的な事例は何か。

 大容量データを高速に扱うユーザーは増えている。例えば,ヘルスケアや石油探索を手がける企業や政府などだ。Webサイトでは,世界最大のSNS(Social Networking Service)で世界第2位のアクセス数を誇るポータル・サイト「MySpace.com」が好例である。同サイトは動画や画像などの大容量データをアップロードして公開可能であり,2006年7月には70億件に上る映像データのダウンロードがあったが,これらのファイルはすべてIsilon IQに格納されている。

 ジェット・エンジンを開発している米Pratt & Whitneyでは,シミュレーションなどに用いる分析データを単一の巨大な論理ファイル・システムに格納することによって,新型エンジンの開発にかかる期間を従来の6カ月から6週間へと短縮した。以前は複数のディスクに分散したデータをまとめて分析することが難しく,開発期間が余計にかかってしまっていた。

---分散ファイル・システムの機能は高まっているか。

 2006年10月に出荷した最新版のOneFS 4.5では,1クラスタあたり最大96ノードまで接続可能になった。これにより,1論理ファイル・システムの最大容量は1ペタ・バイトとなり,データ転送速度は10Gバイト/秒となった。加えて,N+3およびN+4の冗長構成を採れるようにした。万が一ノードが同時に4台壊れてもデータを保持できる。

 OneFS上で稼働する新ソフトも2種類出荷した。1つはストレージ内部でスナップ・ショットを作成するバックアップ・ソフト「SnapshotIQ」だ。スナップ・ショットとはいえ差分だけをコピーする形式とした。特徴は,スナップ・ショット用にあらかじめ容量を確保しておく必要がない点,スナップ・ショットを取る数が無制限である点などである。

 クラスタ全体での負荷分散を,あらかじめ定めたポリシーに従って制御するソフト「SmartConnect」も出荷した。OneFS単体ではファイル・アクセスごとに単なるラウンド・ロビン形式でノードを割り当てるだけだが,SmartConnectでは,ノードごとのCPU使用率やスループットなどを考慮した上で,ファイル・アクセスのユーザーや部署ごと,使用するアプリケーションごとに優先制御を施すなど,QoS(品質)を設定して運用することが可能になる。