◆テープ

 企業のバックアップ用ストレージとして,今でも重要な位置を占めるのがテープである。一時はすべてのバックアップを低価格HDDで済まそうという動きもあったが,HDDとテープ装置それぞれの特徴を活かしたバックアップ/アーカイブ用システムを構築する方向に変化してきている。HDDと比べてテープ装置は地味な存在だが,現在でも進化を続けているストレージであり,今後もメディアの可搬性やコストの低さ,大容量性などの理由により,存在意義を失うことはない。

 例えば,HDDがバックアップ・メディアとして利用されるようになっても,最終的にはD2D2T方式に落ち着くはずだ。単純なDisk to Disk(D2D)方式では,データの保護が不完全だからである。また,バックアップのウインドウ(実行可能な時間帯または実行時間),データのサイズ,アプリケーション・ソフト,リストアの要件,そしてコストの面などから,従来通りのDisk to Tape(D2T)で十分なことも多いだろう。決して流行を鵜呑みにすることなく,多方面からの判断が必要になる。

テープの記録容量も急速に拡大

 テープ装置と一口に言っても,種類が非常に多い。テープ装置は典型的なリムーバブル装置であり,ドライブの記録方式とメディアのカートリッジ形状にはそれぞれ複数の規格がある。メディアのカートリッジ形状が異なれば,当然ながら互換性はない。この点は,どのメーカーの製品にも互換性があるHDDと大きく異なる。

 もちろん,同じ規格のテープ・ドライブ間はメディアの互換性を保証している。また,旧式の機種で書き込んだメディアの読み取り(場合によっては読み取りと書き込み)も,後継機種で保証されていることが多い。このメディアの互換性の維持がHDDにはない技術的な難しさである。

 HDDと同様に,テープの記録密度も急ピッチで伸びている。例えば,2004年12月現在でテープ一巻の記録容量は,LTO Ultrium Generation3*4のカートリッジ(約10cm四方)の場合で400Gバイト(非圧縮時)だ。もし,同じ400Gバイトのデータをメインフレーム誕生当時のオープンリール・テープに保存しようとしたら,テープの総延長は2万6000kmとなり,東京−ロンドン間(1万2400km)を往復しても余りがある(図4[拡大表示])。テープの記録密度は40年間で3万倍以上になり,今後も着実に伸びていくはずだ。

 こうした技術革新を背景に,テープ装置のデータ転送速度も高速化している。意外に思われるかもしれないが,HDDの最外周における最大データ転送速度と比較しても遜色ないレベルに達しているのだ。最新のLTO Ultrium Generation3では80Mバイト/秒であり,1万5000回転のHDDの最大データ転送速度と同程度である。

◆ネットワーク型ストレージ

 従来,ストレージとネットワークは別々に進化してきたが,近年になり両者の融合が図られている。ストレージがサーバーなどに直接接続されている形態「DAS(Direct Attached Storage)*5」の限界や問題点を解決するためである。

 DASそのものは導入時のコストが低く,データ転送の効率も高いのだが,ストレージを接続したサーバーの「専用」となってしまうなど,資源の共有や管理の面での柔軟性に問題がある(図5[拡大表示])。また,ストレージの接続台数や装置間の距離にも制限がある。

 ネットワーク上で複数のサーバーがストレージを共有する「ネットワーク型ストレージ」は,このような問題の解決策として急速にシェアを伸ばしている。その代表格はSANとNASである。

 SANは,各種のストレージ(ディスク・サブシステム,テープ・ライブラリなど)を個々のサーバーから切り離し,ストレージ専用のネットワークを介して共有するものだ。SANは,その名の通りストレージ専用の「ネットワーク」を指すこともあるが,一般的には接続されるストレージも含めた環境全体を指すことが多い。SAN上で使用されるストレージやサーバーは,インタフェースとして広帯域幅および高データ転送効率を持つファイバ・チャネルで接続することがほとんどで,これをFC-SANと呼ぶ。

 ファイバ・チャネルで接続することによって,装置間の接続距離と接続台数の仕様(理論的な限界)は飛躍的に向上した。そのため,多数のサーバーが多数のストレージを共有したり,資源を一元管理したりすることが可能になった。

 一方,NASは「ファイル・サーバー」と機能面では同等である。LAN上に設置し,ファイル・サーバーにアクセスするときと同じプロトコル「CIFS(Common Internet File System)」や「NFS(Network File System)」を使ってアクセスする。ファイル・サーバーとの違いは,ファイル共有に特化した専用機として各種の機能や性能が最適化されている点にある。異種OS間でのファイルの共有も容易になる。

◆ILM

 この1~2年,ストレージ分野では「ILM(Information Lifecycle Management)」が話題となっている。企業の保有データ量が急速に増大している問題に対して,データへのアクセス頻度別に各種ストレージを使い分け,コストを最適化する概念である。

 データには,「頻繁にアクセス(利用)されるもの」や「ほとんどアクセスされないが保存しなければならないもの」など,利用頻度の異なるものが混在している。このような特性を表しているのが図6[拡大表示]である。縦軸はアクセス頻度を示し,横軸はストレージの全空間に占めるサイズを示している。「ホット」と呼ばれる領域は,最も頻繁にアクセスされているところだ。ストレージへのアクセス総数の80%を占めるが,全ストレージ空間に占める比率は10%程度とされている。この領域では,データの入出力性能が求められる。

 逆に,全ストレージ空間の80%程度を占めていながら,ほとんどアクセスされないところがある。これが「コールド」と呼ばれる領域である。ここではデータの入出力性能より,データの保存コストの低さが優先されるだろう。

 「ウォーム」領域にあるデータは,アクセス頻度もストレージ空間に占める比率も「ホット」と「コールド」の中間に位置する。

 データへのアクセス頻度の違いは,主にデータが作成されてからの時間経過(あるいはライフサイクル)によってもたらされる。一般に,データへのアクセス頻度(利用価値)は時間とともに減少する傾向があるようだ。これは日常的にも経験しているだろう。WordやExcelで作成したファイルは,作成後数日間は頻繁に利用するが,数週間経つとほとんど利用する機会がなくなるのと同じである。

 ある報告によれば,データの80%はビジネス面で継続的に使用されることのない複製データであり,ディスク上にあるデータの90%は作成後90日以上経過するとほとんどアクセスされなくなるという。ただし,アクセス頻度が低下したデータでも,ビジネス上の理由から長期的に保存すべき場合は多い。法的規制のあるデータなら,数年にわたる保存の対象となる。

 これらアクセス頻度が異なるデータを1種類のストレージで運用することは,特にコスト面から無駄があり,非効率的である。ILMは,ライフサイクルによって変化するデータのアクセス頻度に合わせて最適なストレージを組み合わせ,それらを統合的に管理することを目指している。

 例えば「ホット」領域のデータは,アクセスが多いので入出力性能の高いディスク装置に格納する。しかし,「ウォーム」のデータは,やや低速でも大容量・低価格なディスク装置に格納するほうがコスト的に有利である。また,「コールド」領域のデータは,低コストなテープ(あるいはテープ・ライブラリ)に保存するのが得策といえる。

 ILMは発展途上の技術だが,その基本的なコンセプトは,肥大化するデータを低コストで管理したい企業のニーズにマッチするのではないだろうか。こうしたストレージ環境を構築するには,各種ストレージの原理や特徴,最新のスペックを理解して,適材適所で配置できるようにしたい。

◇     ◇     ◇

 次回は,ストレージのメインストリームであるハードディスク・ドライブの内部構造とスペックの読み解き方を解説していく。


吉岡 雄
日本ストレージ・テクノロジー マーケティング本部 シニアスペシャリスト