重複するファイルによってストレージが占領されてしまうのは,ストレージ管理者にとって最も悩ましい問題である。1Mバイトの文書ファイルが大企業のネットワークに放たれると,個々のユーザーがそれぞれ自分用のコピーを作成するため,数百Mバイトのストレージがすぐに消費される。ファイル・サーバーが重複ファイルで占領されると,バックアップのオーバーヘッドも大きくなる。

 ストレージ・ベンダーは,「データ重複排除(dedupe)」という概念を導入して,重複データ問題に対処している。この手法を用いると,重複データは削除され,そのデータの単一の物理コピーのみが残される。削除されたデータ・ファイルは「リンク」に置き換わり,そのファイルをクリックすると,削除されなかったファイルが参照される。バックアップする必要があるのも,そのデータの単一のコピーだけである。

 データ重複排除技術によって,バックアップやストレージのメディアを以前よりもはるかに効率的に使えるようになる。バックアップに必要なストレージが少なくなるだけでなく,バックアップにかかる時間も大幅に短縮できる。なぜなら,重複削除はバックアップ・プロセスのフロント・エンドで行われるからだ。バックアップに割ける時間が限られている組織にとっては,この時間の短縮も大きな利点となるだろう。

 データ重複排除技術は,顧客やベンダーにとって非常に優先順位の高い問題なので,多くの新製品で重要な位置を占めるようになっている。そうした新製品は,企業ネットワークやSAN環境を保護するために設計されたハイエンドのクロスプラット・フォーム専用ハードウエアである「仮想テープ・ライブラリ(VTL)」から,単一サーバーや小規模企業を保護するために設計された製品に至るまで,様々なものがある。結局のところ,企業が大きくなればなるほど,データ重複排除の効果は大きくなるのだ。

 例えば,大企業向けの製品には,リリースされたばかりの「Quantum DXi7500 Enterpriseバックアップ・システム」がある。DXi7500は,データの重複排除とリモート・データ保護に重点を置く,エンタープライズ・クラスのハードウエア・バックアップとデータ保護用のアプライアンスだ。DXi7500は,重複排除をバックアップ・アーキテクチャの主要コンポーネントとして使用する専用アプライアンスの好例である。DXi7500は最大240Tバイトのデータ容量を提供し,データ・バックアップの重複排除をオン・ザ・フライで行いながら,1時間で最大8Tバイトをバックアップすることを可能にする。

 データ重複排除を使う製品で,もっと幅広い層をターゲットとするものの例としては,現在ベータ段階にある「Microsoft System Center Data Protection Manager(DPM) 2007」が挙げられる。このファイル・サーバー向けのデータ・バックアップと保護用アプリケーションの最新版において,Microsoftは重要な改善点1つとして,オン・ザ・フライのデータ重複排除を追加したのだ。DPM 2007は,Windows Server 2003にインストールすることもできるし,Windows Unified Data Storage Serverをベースにしたネットワーク・アプライアンス・サーバーとして購入することもできる。

 企業の規模に関係なく,データのバックアップと保護のスキームの一部として,データ重複排除ソリューションを検討することは,技術的,経済的な観点から,大きな意義があるだろう。バックアップにかかる時間の短縮とストレージ要件の軽減によって得られる利点は,コンピューティング環境に広範な影響を及ぼすため,データ保護ソリューションを評価するときは,これらの要素を中心に検討する必要がある。