IDC Japanの調査では、国内企業のストレージに蓄積されるOfficeファイルや画像などの非構造化データは、年間62.8%の割合で増加している。こうした“情報爆発”に対処するためのストレージ管理手法として「重複排除」が一般的だが、英Neuxpowerのマイク・パワーCEO(最高経営責任者)は、「クラウドコンピューティングの時代に、重複排除は最善の手段とはいえない」と主張する。クラウド時代のストレージ管理はどうあるべきか、パワーCEOと、Neuxpower製品を販売するオーシャンブリッジの高山知朗代表取締役社長に聞いた。

(聞き手は羽野 三千世=ITpro

ストレージに蓄積される非構造化データが増加している理由は。

写真1●英Neuxpowerのマイク・パワーCEO
写真1●英Neuxpowerのマイク・パワーCEO
写真2●オーシャンブリッジの高山知朗代表取締役社長
写真2●オーシャンブリッジの高山知朗代表取締役社長

高山氏:2009年までは、Officeファイルや画像などのファイル個数が増加していた。2010年以降は、一つひとつのファイルサイズが大型化している。WordやExcelに高解像度のデジタルカメラで撮影した写真を貼り付けて保存したり、PowerPointに元データを含んだExcelのグラフを貼り付けたりしていることが原因だ。

パワー氏:社員の多くは、作成したファイルの大きさを意識していない。知らずしらずのうちに、写真をファイルサイズの大きいTIF形式で保存したり、グラフを見せるだけのプレゼンテーション資料にExcelのテーブルデータを貼り付けたりするケースが少なくない。

膨大な非構造化データを格納するストレージ管理方法として、重複排除が最善の策ではないとするのはなぜか。

パワー氏:重複排除は、バックアップ先などの「セカンダリストレージ」のデータ量を削減する技術だ。社員が直接ファイルを保存する「プライマリストレージ」のデータ量は減らせない。

 データ量削減の一番の目的は、プライマリストレージの消費を抑えることだ。それができてこそ、ネットワーク負荷や電力消費量、排熱、運用負荷の増大といった問題を解決できる。

 Officeファイルに対して、重複排除はあまり効果がないという問題もある。ファイルサーバーなどに保存されるOfficeファイルの多くは、すでに何らかの形で圧縮されている。圧縮処理によりファイル内のデータブロックが移動してしまうと、バックアップ先に同一ファイルが保存されていても別ファイルと見なされ、重複排除の対象とならない。

高山氏:クラウドコンピューティングの時代になり、Officeファイルや画像をクラウド上に置いて、シンクライアント端末やスマートフォンからアクセスするケースが増えている。こうした時代では、重複排除でファイル数を減らすことよりも、個々のファイルサイズを小さくするほうがより重要だ。

 ファイルサイズを小さくすれば、クラウドと端末を結ぶネットワークの負荷が軽くなり、スマートフォンなどの端末でもファイルを扱いやすくなる。Officeファイルや画像のファイルサイズを縮小する製品には、例えば当社が販売しているNeuxpowerの「NXPowerLite」がある。

「NXPowerLite」について教えてほしい。

パワー氏:画像やOfficeファイルのファイル容量を削減する製品だ。画像に対しては、色のサンプリング方式を変換する、「Huffman table」という圧縮アルゴリズムを適用するといった方法でファイルサイズを小さくする。

 Officeファイルに対しては、同じ手法でファイルに貼り込んだ画像のサイズを縮小する。WordやPowerPointなどに含まれるExcelグラフのテーブルデータも取り除く。

 あるユーザー団体が検証したところ、NXPowerLiteによって、ストレージに保存しているOfficeファイルのデータ容量を、Wordは68%、Excelは76%、PowerPointは84%、JPEG画像は50%削減できたという。

高山氏:国内でも多数の導入実績がある。三井造船は、主にPowerPointのファイルサイズ削減にNXPowerLiteを利用している。同社では会議資料や提案資料に、造船の工程や工場の様子を撮影したデジカメ画像を貼ることが多く、ファイルが大きくなりがちだという。

 同社はNXPowerLiteによって、300MバイトのPowerPointファイルを1Mバイトまで縮小したと報告している。また、パナソニック エナジーは、社内のすべてのパソコンにNXPowerLiteを導入し、ファイルサーバー容量を削減した。