ストレージ容量の伸びは一向に衰えを見せない。ストレージ・コストを最適化するILM(Information Lifecycle Management)やストレージの利用効率を高める仮想化技術など,新しいトレンドも生まれている。本講座は,今後のストレージ環境を読み解くための基礎知識や最新のスペックを紹介していく。 なお,本講座は2006年に公開した「【初級】知っておきたいストレージの基礎」を基に,2009年の状況に合わせて加筆・修正した改訂版である。

吉岡 雄
日本クアンタム ストレージ

◆テープの基礎/トレンド

 企業のバックアップ用ストレージとして,今でも重要な位置を占めるのがテープである。一時はすべてのバックアップを低価格HDDで済まそうという動きもあったが,HDDとテープ装置それぞれの特徴を活かしたバックアップ/アーカイブ用システムを構築する方向に変化してきている。HDDと比べてテープ装置は地味な存在だが,現在でも進化を続けているストレージであり,今後もメディアの省電力性や可搬性,コストの低さ,大容量性などの理由により,存在意義を失うことはない。

 例えば,HDDがバックアップ・メディアとして利用されるようになっても,データの長期保存を考慮すると,最終的にはテープに保存するD2D2T方式に落ち着くはずだ。単純なDisk to Disk(D2D)方式では,データの保護が不完全だからである。また,バックアップのウインドウ(実行可能な時間帯または実行時間),データのサイズ,アプリケーション・ソフト,リストアの要件,そしてコストの面などから,従来通りのDisk to Tape(D2T)で十分なことも多いだろう。決して流行を鵜呑みにすることなく,多方面からの判断が必要になる。

テープの記録容量も急速に拡大

 テープ装置と一口に言っても,種類が非常に多い。テープ装置は典型的なリムーバブル装置であり,ドライブの記録方式とメディアのカートリッジ形状にはそれぞれ複数の規格がある。メディアのカートリッジ形状が異なれば,当然ながら互換性はない。この点は,どのメーカーの製品にも装置としての互換性があるHDDと大きく異なる。

 もちろん,同じ規格のテープ・ドライブ間はメディアの互換性を保証している。また,旧式の機種で書き込んだメディアの読み取り(場合によっては読み取りと書き込み)も,後継機種で保証されていることが多い。このメディアの下位互換性の維持がHDDにはない技術的な難しさである。

 HDDと同様に,テープの記録密度も急ピッチで伸びている。例えば,2008年の時点でテープ1巻の記録容量は,LTO Ultrium Generation4のカートリッジ(約10cm四方)の場合で800Gバイト(非圧縮時)だ。もし,同じ800Gバイトのデータを世界最初のコンピュータ・テープに保存しようとしたら,テープの総延長は約23万4000kmとなり,地球を5周以上するくらいの長さになる(図1)。テープの記録密度については,ここ40年間で10万倍以上に伸び,今後も着実に伸びていくはずだ。

図1●急ピッチで伸び続けるテープの記録密度
図1●急ピッチで伸び続けるテープの記録密度
1952年当時,世界最初のコンピュータ・テープ1巻に記録できた記憶容量は2.5Mバイト。それから50年以上を経た現在は,LTO Ultrium4の場合でカートリッジ1巻に800Gバイトを記録できるようになった

 こうした技術革新を背景に,テープ装置のデータ転送速度も高速化している。意外に思われるかもしれないが,HDDの最外周における最大データ転送速度と比較しても遜色ないレベルに達しているのだ。現在のLTO Ultrium Generation4では120Mバイト/秒(非圧縮時)であり,1万5000回転のHDDの最外周における最大データ転送速度と同程度である。

◆普及したネットワーク型ストレージ

 従来,ストレージとネットワークは別々に進化してきたが,近年になり両者の融合が図られている。ストレージがサーバーなどに直接接続されている形態「DAS(Direct Attached Storage)」の限界や問題点を解決するためである。

 DASそのものは導入時のコストが低く,データ転送の効率も高いのだが,ストレージを接続したサーバーの「専用」となってしまうなど,資源の共有や管理の面での柔軟性に問題がある(図2)。また,ストレージの接続台数や装置間の距離にも制限がある。

図2●サーバーに直結したストレージ(DAS)の主な問題
図2●サーバーに直結したストレージ(DAS)の主な問題
DASはコストが低く,データ転送の効率もよいが,多数のサーバーを抱える中規模以上の環境では様々な問題が生じる

 ネットワーク上で複数のサーバーがストレージを共有する「ネットワーク型ストレージ」は,このような問題の解決策として急速にシェアを伸ばしている。その代表格はSANとNASである。

 SANは,各種のストレージ(ディスク・サブシステム,テープ・ライブラリなど)を個々のサーバーから切り離し,ストレージ専用のネットワークを介して共有するものだ。SANは,その名の通りストレージ専用の「ネットワーク」であるが,一般的には接続されるストレージも含めた環境全体を指すことが多い。SAN上で使用されるストレージやサーバーは,インタフェースとして広帯域幅および高データ転送効率を持つファイバ・チャネルで接続することがほとんどで,これをFC-SANと呼ぶ。

 ファイバ・チャネルで接続することによって,装置間の接続距離と接続台数の仕様(理論的な限界)は飛躍的に向上した。そのため,多数のサーバーが多数のストレージを共有したり,資源を一元管理したりすることが可能になった。

 一方,NASは「ファイル・サーバー」と機能面では同等である。LAN上に設置し,ファイル・サーバーにアクセスするときと同じプロトコル「CIFS(Common Internet File System)」や「NFS(Network File System)」を使ってアクセスする。ファイル・サーバーとの違いは,ファイル共有に特化した専用機として各種の機能や性能が最適化されている点にある。異種OS間でのファイルの共有も容易になる。