これまで一般企業の情報基盤では扱うことが難しかったような大量のデータを取得し、自由自在に分析して、その結果から得られた対応策を日常業務の中で実行することが可能になってきた。大量のデータを処理できる専用マシンや、高機能なオープンソースソフトウエアの登場がそれを後押ししている。

データ・ウエアハウスが進化
専用マシンで速く、クラウド技術も身近に

図1●大量データを高速に処理する専用マシンの登場が、データの取得・分析・実行を後押ししている
図1●大量データを高速に処理する専用マシンの登場が、データの取得・分析・実行を後押ししている
[画像のクリックで拡大表示]

 「IT(情報技術)の発達がなければ、新営業情報システムを実用化するのは難しかった」。近鉄百貨店でMD(マーチャンダイジング)統括本部長を務める岡本嘉之執行役員は、2008年11月に稼働した「新営業情報システム」についてこう話す。同システムでは各店舗に設置されているPOS(販売時点情報管理)システムや、予算や財務を管理する会計システム、顧客管理システムなどと「神経」をつなぎ、様々なデータを取得している。取引明細データなら3年分、顧客データなら5年分が蓄積されている。

 全社のデータを取得・分析するDUSH基盤を開発した大阪ガス情報通信部情報ソリューションチームの細川嘉則マネジャーも「データ分析技術が急速に発展したことがDUSH基盤を考えるきっかけになった」と振り返る。

 両社が構築したデータ・ウエアハウスの容量は、近鉄百貨店が5テラバイト(TB)、大阪ガスが20TBと巨大だ。数年前までは企業がテラ級のデータを蓄積して分析し、その結果を日常業務に生かすのは容易ではなかった。大量データを高速で処理する技術が十分に提供されていなかったからだ。

 これまでの企業の常識を超える「ビッグデータ」を取得し、自由自在に分析して、その結果から得られた対応策を日常業務の中で実行したい─。こうした切なる思いを解決する手段として注目されているのが、大量データ処理を可能にした専用マシンの登場である(図1)。実際、近鉄百貨店は日本テラデータ製、大阪ガスは日本オラクル製の専用マシンをそれぞれ導入した。

最新技術で高速処理を追求

 専用マシンは大量データを保存するストレージ機能を持つだけではなく、データを高速処理する最新技術を取り入れている。日本テラデータが2010年11月に出荷を始めた専用マシン「Teradata Extreme Performance Appliance 4600」は、記憶装置に「SSD(ソリッド・ステート・ドライブ)」と呼ばれる仕組みを採用し、データ処理を高速にしている。SSDはハードディスク(HDD)の代わりにフラッシュメモリーを用いており、HDDよりも高価だが読み書きが速い。一方、日本オラクルの専用マシン「Oracle Exadata」はデータを圧縮したり検索方法を従来と変更したりして、検索速度をこれまでの10倍以上に高めた。

 専用マシンを利用すると、大量データを高速処理するデータ・ウエアハウスを短期間に構築できる。近鉄百貨店が新営業情報システムの開発にかけた期間はわずか半年だ。一般的なデータベースをチューニングして高速化する労力や最適なハードを探す手間を、専用マシンを取り入れて省いた。

図2●サイバーエージェントはOSSで構築したログ分析システム「PATRIOT」を実用化
図2●サイバーエージェントはOSSで構築したログ分析システム「PATRIOT」を実用化
[画像のクリックで拡大表示]

 短時間に大量データを高速処理できる専用マシンは、会社の「中枢神経」ともいえるデータ・ウエアハウスを構築するのに便利なのは間違いない。ただし価格は数千万円から数億円もする。それ以外にシステム構築のサービス費用がかかるため、構築には億単位の費用がかかるのが一般的である。投資対効果の判断に悩むところだ。

 構築費用を抑える選択肢として急浮上しているのが、オープンソースソフトウエア(OSS)である。サイバーエージェントはOSSでデータ・ウエアハウスを構築済みだ。2010年7月から、600万人以上の会員を抱えるコミュニティーサービス「アメーバピグ」やゲームサイトから50TBものログを取得・分析し、サービス改善に生かすシステム「PATRIOT(パトリオット)」を使う(図2)。