過去にEMCが複数企業のファイルサーバーを調査したところ「約75%のデータが90日以上アクセスされていない」という結果が出た(図1)。
ファイルサーバーのデータに限らず、どの企業でもストレージ内のデータは同じような傾向にある。膨張し続けるデータを野放しにするのではなく、企業としてはコストや運用の効率性を高めるために何らかの対策を施したいところだ。今回は、このような課題を解決するストレージのアーカイブや階層化機能について解説する。
ストレージの階層化とは
データの価値や活用頻度は、時間の経過と共に変化する(図2)。同時にデータ容量は増加し続けるが、全体の割合で見ると75%以上のデータはアクセス頻度が低い。従って、全てのデータを高性能で高価なストレージに保管することは、コストの観点で非効率と言える。既存のストレージ以外に安価なストレージを準備して、アクセス頻度が低いデータをうまく配置すれば、効率的にストレージを利用できる。これがストレージ階層化の考え方だ。
一方、アプリケーションの視点で考えると、ストレージは一定以上の性能を確保し続けることが求められる。頻繁にアクセスするデータは、時間の経過に関わらず高性能なストレージで保管すべきだろう。さらに、しばらくアクセスしていなかったデータも、後からアクセス頻度が高まる可能性がある(図3)。スト レージ階層化であれば、性能要件を満たし、アクセスの変化にも対応可能だ。