米DataDomain 社長兼CEOのFrank Slootman氏(写真右)と,同社チーフ・アーキテクトのHugo Patterdon博士(写真左)
米DataDomain 社長兼CEOのFrank Slootman氏(写真右)と,同社チーフ・アーキテクトのHugo Patterdon博士(写真左)
[画像のクリックで拡大表示]
DD400
DD400
[画像のクリックで拡大表示]

 テープではなくディスクにデータをバックアップする---。アクセス速度が高速なディスクをバックアップ媒体として利用する企業が増えている。こうした中,米Data Domainはデータ・バックアップ専用のディスク装置を開発する。2006年5月26日,米Data Domain社長兼CEO(最高経営責任者)のFrank Slootman氏と,チーフ・アーキテクトのHugo Patterdon博士が来日。ITproの質問に答えた。

---バックアップ媒体としてテープからディスクへの移行はどのくらい進んでいるか。

Frank Slootman氏:米Data Domainは,ディスクを用いたデータ・バックアップの世界では先駆者に当たる。過去2年間で,容量にして10ペタ・バイト(1万Tバイト)の出荷実績を持つ。だが,業界全体で見るとディスクへのデータ・バックアップというトレンドは,ようやく表面化してきたというのが現状だ。今後本格化していくだろう。

---バックアップ用にディスクを捉えた時,ファイル・サーバーであるNASである理由は何か。

Hugo Patterdon博士:ユーザー要件によって必要となる装置の種類も異なるため,ファイル・サーバーであるNASの形態に加えて,バックアップ・ソフトから使えるもう1つの選択肢であるVTL(仮想テープ装置)のインタフェースも米Data Domainは用意している。VTLは,ディスクをあたかもテープ装置であるかのように見せるものであり,ファイバ・チャネルで接続する。

 VTLから見たNASの優位性は,設定が容易であるということだ。VTLでは,テープ・カートリッジの事前の配置など,テープ装置として見えていることにより必要になってくる要素がある。一方のNASは,接続が容易であり,簡単にアクセスできる。

Frank Slootman氏:現状,米Data Domainのほとんどの出荷実績は,NASによるものだが,この理由は,VTLよりもNASの方が取り扱っている年数が長いというものだ。VTLの需要は確実に存在している。VTLの出荷実績も今後増えていくと見ている。

---WAN経由のレプリケーションを提案している。どんな事例があるか。

Hugo Patterdon博士:データ圧縮効果は特徴的だ。典型的な企業データなら,50倍から60倍の圧縮ができる。100GバイトをWAN回線を通して送る際に,データ圧縮機能があるために2Gバイトで済む。

Frank Slootman氏:スイスの電力会社最大手であるAxpoの事例を示そう。Axpoは,独SAPや米Oracleのデータを毎日バックアップしている。バックアップ量は220Tバイトにに達するが,米Data Domainのデータ圧縮によって4Tバイトのバックアップで済んでいる。WAN回線を経由したデータのレプリケーションも毎日実施している。

Hugo Patterdon博士:これはほんの一例に過ぎない。米Data Domainが出荷した出荷数の実績のうち,40%の数に当たる装置がレプリケーション・ライセンスと同時に購入している。装置の数と顧客数は同じというわけではないが,多くの顧客がWAN回線を経由したレプリケーションを実施しているということだ。

---従来はWANを介して1:1で対向型に設置する必要があった。N:1のレプリケーションはできるようになったのか。

Frank Slootman氏:N:1の接続は2006年5月に実現した。すでに出荷を始めている。N:1の接続に加え,ピア・ツー・ピア型の接続も実現済みだ。

Hugo Patterdon博士:ピア・ツー・ピア型の接続とは,双方向のレプリケーションを可能にするものだ。ファイル・ディレクトリ単位で,データ・センターAからデータ・センターBへ,あるいはその逆にデータ・センターBからデータ・センターAへ,データをレプリケーションできるようにする。従来は,データ転送の方向が1方向だけだった。ピア・ツー・ピア型は,双方向のデータ転送を可能にした。

 N:1は,スター型の接続だ。複数の遠隔拠点を1カ所の巨大なデータ・センターの下にスター型にぶら下げるネットワーク接続ができる。従来は遠隔拠点からのデータ転送を受けるために遠隔拠点ごとに別個の装置を設置する必要があったが,現在では1台で複数の拠点からの接続をまとめて受けられるようになっている。

---WAN経由でデータを転送する機能の強化は,顧客からの要望が強いのか。

Frank Slootman氏:その通りだ。顧客は経済性の高い方法を選ぶ。データを圧縮し,圧縮したデータをWAN経由で転送する。これが効果的なのだ。

Hugo Patterdon博士:WANを経由した先にデータを格納する“WAN Vaulting”は,テープを削減するためには必須だ。なぜなら,地震や火事などの災害を想定すれば,データのコピーを遠隔地に置くことが重要だからだ。米Data Domainの装置は高速なのでローカルだけで使っていてもデータのリストアには有効だが,遠隔地にデータのコピーを配置しない場合,災害対策を考えれば依然としてテープが必要になってしまう。だからWAN Vaultingが必要なのだ。WAN Vaultingがあればテープは必要なくなる。

---災害対策という点で遠隔地へのレプリケーションは有力だが,遠隔拠点に分散したデータの集約という意味ではWAN高速化や画面情報端末など,そもそもデータセンターにだけデータを置く方法もある。

Hugo Patterdon博士:言っていることは十分に理解している。だが,パフォーマンスと作業量次第だ。WANを介したデータ・アクセスよりも拠点にデータを置く方がデータ・アクセスなどアプリケーションの性能が高いことは間違いないからだ。拠点によってはデータをほとんど持たない場合がある。こうした場合はWANを介したデータへのアクセスも可能になる。データをデータ・センターに一極集中化していても許容できる性能が得られるかどうかということだ。

 米Data DomainとしてはWANを経由したデータ・アクセスを否定しているわけでは決してない。加えて,WAN Vaultingができなかった従来と比べ,WAN Vaultingが可能になった現在では,ローカルにデータがあることのデメリットは少なくなった。拠点のローカル・データのコピーはデータ・センターで管理できるからだ。

---米Data Domainの装置のコア機能は,ディスク全体での冗長性を排除することにある。仕組みの概要を教えて欲しい。

Hugo Patterdon博士:グローバル圧縮とローカル圧縮の2つのステップで圧縮する。グローバル圧縮により,典型的なデータの場合で25倍程度に圧縮できる。次のローカル圧縮により,およそ2倍に圧縮できる。組み合わせることで,50倍ほどの圧縮率が得られるというわけだ。

 グローバル圧縮は,ディスク全体を通して冗長性を排除するものであり,同じデータの重複書き込みを避けることで書き込み量を減らす。仕組みはこうだ。バックアップするためのデータが入ってくると,まずデータを4K~16Kバイトのセグメントに分割する。1つのセグメントの中身が同じ内容で過去に書き込まれていた場合,過去に書き込まれたデータを参照するための情報,つまりメタデータだけを書き込み,データそのものは書き込まない。ディスク全体を通して冗長度が極めて低い状態にする。つまり書き込んだ時に,すでに圧縮された状態になる。

 ローカル圧縮は,グローバル圧縮において重複しているかどうかを調べる単位であった個々のセグメントごとに独立して圧縮をかけるものだ。個々のセグメント内部でのデータの冗長性を排除するというわけだ。つまりローカル圧縮は,gzipなどでファイルを圧縮するように,個々のセグメントを圧縮するものだ。