情報処理に不可欠な記憶装置を階層化するというアイデアはCPUの歴史と同じくらい古くからあるものだ。1種類の記憶領域にすべてのデータを格納するのではなく,高速少量のものから低速大容量のものまで,複数の記憶領域を組み合わせて使用することで,性能の向上とコスト削減の両立を目指すという考え方である。

 この考えは一般的な現在のコンピュータ・システムで,CPUのレジスタ,1次キャッシュ,2次キャッシュ,…,メイン・メモリー,外部記憶(いわゆるストレージ)と細かく階層化された記憶領域を持つというように広く行われている手法である。この手法が有効なのは,一つは特定の時間のコンピュータ・プログラムの動作に必要なデータは全体のごく一部であるということ(データの局所性)と,高速な記憶領域ほどコストが高いためそれですべてを賄うことができない(コスト原理)という理由による。

 外部記憶としてひとくくりにされるストレージ・システムも同様で,高性能なストレージのみでITシステムすべてを構築できるのであればよいが,昨今顕著になってきた急激なデータ容量の増加やITシステム全体に対するコスト抑制要求から,ストレージ・システムとしても階層化することで大容量とコスト削減を両立させることが必要となってきている。

 またそういった要求に応える形で,いくつかの新技術により階層化ストレージを構築・運用することが多くの現場で利用可能となってきている。ストレージ自体の階層化はHSM(Hierarchical Storage Management)という名称で以前から実用化されていたが,HSMは通常のディスクを一次領域,ライブラリに入れたテープやCD-Rなどを二次領域として組み合わせていた。そのため,二次側へのアクセスが遅く,利用現場が制限されることも多かった。

 ただ,最近はより細かく階層を持ち,柔軟なストレージ構成を組むことができるようになってきている(図1)。

図1●階層化ストレージのコンセプト
図1●階層化ストレージのコンセプト

 ここで階層化ストレージに行きつく要件を以下に大別して考える。

  1. ストレージのコスト削減と大容量化の両立
  2. 係争や訴訟対応などを目的としたデータの超長期保存
  3. 処理性能を犠牲にしないストレージの大容量化

 「1.コスト削減と大容量化の両立」が,今,直面する課題であり基本的な要件である。コスト削減も大容量化もどちらか一方を単独で実現することは比較的容易だが,二つの要件を両立させた上で,従来と同様に業務を行うことができる環境とするこ単純ではない。

 この1.の要件に,「2.超長期保存」や「3.処理性能を犠牲にしない」という要件が加わるケースが多い。そこで,1.の要件に応える階層化ストレージをベース構成として,2.の要件や3.の要件に応える構成を検討する(図2)。

図2●階層化ストレージの構成例
図2●階層化ストレージの構成例

 2008年版の階層化ストレージ・アーキテクチャを考えるに当たり,ファイル・サーバーとメール・サーバーを例にする。昨今のデータ量増加の大半は非構造化データと呼ばれるファイル,具体的にはオフィス文書や画像や動画などのマルチメディア系のデジタル・データだからである。

要件1.ストレージのコスト削減と大容量化の両立

 ストレージのコスト削減と大容量化を両立させる2008年版の手法はアーカイブである。

 アーカイブとは,狭義には複数のデータを保存目的で一つにまとめておくことである。だが,アーカイブ対象となるのは本来的にアクセス頻度の低いデータであることから,単にまとめておくだけでなく,低コストのストレージにデータを移すことを意味するように変化してきている。その際に改ざん防止機能と組み合わせて監査証跡として保管する機能も合わせて持つが,そちらの機能については本稿の範囲ではないので割愛する。

 アーカイブのポイントは,業務サーバー(ファイル・サーバー,メール・サーバー)の管理データを減らせることである。

 メール・サーバーの場合,メール一つひとつは上書きされることが(ほとんど)ない上,同報やメール・リストなどで複数のユーザーに同一データが配信されているため,アーカイブ処理により圧縮したり,シングル・インスタンス化したり,さらには重複データを排除したりすることで,データ保存領域の削減につながりやすい。

 アーカイブしてメール・サーバー上のデータ容量を減らすことにより,メール・サーバーの性能向上につながる。メール・サーバー上のデータが減ることでメール・サーバーのバックアップを行うシステムの負荷も下がり,バックアップ・ウインドウの短縮などサービス・レベルの向上につながる。

 一方,ファイル・サーバーの場合,管理するデータ量の増加に従いバックアップの負荷が問題となることが多い。データ量の増加はそのままフルバックアップの実施に必要な時間(バックアップウィンドウ)の増加につながるし,差分(増分)バックアップにおいてもバックアップすべきかどうかのスキャンに時間がかかってしまうためである。リストアに必要な時間(RTO)も増えてしまうので,バックアップのSLAを順守できなくなることもある。データの重複も少なからず存在するので,シングル・インスタンス化や重複データ排除機能を持つアーカイブ・システムの導入メリットは大きい。

 アーカイブ・データは低速・大容量なストレージに記録することが一般的である。アーカイブ・データへのアクセス頻度は低いので,アクセスに“多少の”時間がかかっても許容できる,という考えに基づく。一般的ではないが,業務用サーバーのストレージと同じグレードのストレージをアーカイブ・ストレージとして使用することもある。この場合,コスト削減効果は少なくなる代わりに,アーカイブ・データへのアクセス速度の低下を最小化できる。

 アーカイブすることによる業務サーバーの負荷削減と性能向上,バックアップシステムの負荷削減とサービス・レベル向上などの効果はアーカイブ・ストレージの性能によらないので,コスト削減効果とアクセス性能の低下をてんびんにかけてアーカイブ・ストレージの必要性能とアーカイブ・ポリシーを決めるのがよいだろう。

 大多数の環境ではメールで30日,ファイルで3カ月を過ぎたデータへのアクセス頻度は極端に低くなるので,そのようなデータをアーカイブしてもアクセス速度低下の悪影響はほとんどないといえる。


成田 雅和(なりた まさかず)
シマンテック グローバルコンサルティングサービス ジャパン ソリューションサービス部 マネージャ
国内系製品開発メーカーにて,コンピュータ開発支援装置などの製品開発を担当する傍ら,海外関連事業にも携わる。その後、国内系SI会社において,関連会社であるデータセンター事業者が提供するデータセンターおよびストレージサービス,オンライン証券システム,デジタルコンテンツ販売システムなど,100以上のシステムの設計,構築,サービスインを担当。また,自社のISMS取得やプライバシーマーク取得プロジェクトにも参画。その後,2005年にベリタスソフトウェアに入社し,合併に伴うシマンテックへの移籍後,金融,製造,製薬業界のバックアップのソリューションの刷新,災害復旧(ディザスタリカバリ)やアーカイブシステムの構築を担当。現在は,コンサルティングサービスのソリューションサービス部のマネージャとして,シマンテック製品の導入に関するコンサルティングを担当している。