米Pure Storage(ピュア・ストレージ)は、SSDを採用したSAN接続型の外付けフラッシュストレージアレイ「Pure Storage FlashArray」を開発しているベンダーである(関連記事1、関連記事2)。SSDのランダムI/O性能を生かした独自のRAID機能や重複排除機能に特徴がある。同社の製品担当にフラッシュストレージの動向を聞いた。
フラッシュストレージの動向は。
フラッシュストレージ市場は過去5年間で大きく変化した。
第一世代のフラッシュストレージは、2009年から2010年にかけて登場した。当時の製品が注力していたのは性能であり、問題点は価格が高かったこと。このため、DBMS(データベース管理システム)など特定のアプリケーションを高速化する用途に特化して使われていた。
2012年頃から、フラッシュストレージの価格が下がった。Pure Storageが初めて製品を出荷したのも2012年のこと。Pure Storageでは特に、重複排除とデータ圧縮によって容量当たりのコストを大幅に削減した。
フラッシュのコストが下がったことで、企業情報システム(エンタープライズ)の1次ストレージとして汎用的に使えるように機能拡張が施されていった。2014年現在、Pure Storageに加えて大手ストレージベンダー各社がエンタープライズ向けに汎用のフラッシュストレージを提供している。
2年後の2016年には、クラウドはすべてフラッシュベースになる。フラッシュのコストが下がることで、1次ストレージだけでなく2次ストレージにもフラッシュが使われるようになる。ストレージI/Oの高速化によって仮想化の採用も進むだろう。
他社と比べたPureStorage製品の利点は。
データの削減手法として重複排除とデータ圧縮の両方が使えること、さらに重複排除のチャンク(分割データ)のサイズが512バイトと細かいことだ。これは、データベースや仮想化環境などの様々なアプリケーションの用途に対してマルチに使えることを意味している。
重複排除は特にサーバー仮想化環境で有効だ。仮想マシンイメージの格納領域を大きく削減できる。また、VDI(デスクトップ仮想化)も、重複排除の重要なユースケースだ。VDIは世界的に普及しており、企業によっては数万人ものユーザーが使っている。これらの仮想マシンイメージを削減できる。
データ圧縮は、データベースのように重複排除が効きにくいアプリケーションでも一定の効果が得られる。オンライントランザクション処理やオンライン分析処理を高速化できる。実際に、米LinkedInは本番環境のデータベースにPure Storageのアレイを使っている。
Pure StorageのWebサイトでは、Pure Storageのユーザーが重複排除とデータ圧縮によってどれだけのデータ削減効果を得られているかをリアリタイムに表示している。30秒ごとにデータを収集し、5分ごとにWebサイトのデータを更新している。日本時間の2014年7月15日午後6時5分現在、重複排除とデータ圧縮で5.65倍、シンプロビジョニング併用で12.33倍のデータ削減効果がある。