「オンメモリー・データベース」を採用して、大容量データベースの処理性能を劇的に向上させたユーザー企業が出てきている。すべてのデータをストレージではなく、サーバーのメモリー上に置き、処理速度を改善。これまで「作れなかったシステム」を実現できるようになった。技術志向のベンチャーが相次いで製品を出し、安価に大容量データベースを処理したいユーザーがリスクをとって採用に動いている。

(岡本 藍)


【無料】サンプル版を差し上げます本記事は日経コンピュータ3月6日号からの抜粋です。そのため図や表が一部割愛されていることをあらかじめご了承ください。本「特集2」の全文をお読みいただける【無料】サンプル版を差し上げます。お申込みはこちらでお受けしています。なお本号のご購入はバックナンバーをご利用ください。

 「システム統合を3年前から考えていたが、データベースの処理性能に限界があったため実現できなかった。オンメモリー・データベース製品に出会い、これを採用したことで、10億件の販売データを翌日すぐに分析できるシステムを構築できた。『システム統合は無理』、『実績のない新技術を使うのは無茶』と言われたが、思い切って取り組んだかいがあった」

 シジシージャパン(CGCジャパン)の草留正樹チームリーダー(企画本部システム企画推進チーム)は、2005年12月に稼働させた「CGCリンクトータルシステム」への思いをこう語る。CGCジャパンは、中堅中小の食品スーパーマーケット200社余りで構成するボランタリーチェーン「CGCグループ」の全国本部である。

 新システムが扱う販売実績データの総量は約10億件。新システムを使う食品スーパーなど134社803店舗の販売実績400日間分を集めると10億件になる。10億件のデータを加盟企業が自由かつ多角的に分析するために、大容量データベースを高速処理する仕組みが必要だった。

 CGCジャパンは、数理技研のオンメモリー・データベース「Core Saver」を採用。オンメモリー・データベースは、メモリー上にすべてのデータを置く。ディスク装置にアクセスしないので高速処理が可能となる。

 CGCグループの食品スーパーは、自社のPOS端末を使って得た販売データを、CGCリンク トータルシステムに日々送信し、統合データベースに書き込んでいく。食品スーパーの仕入れ担当者は翌日から直ちに、前日から400日前までの販売実績データを使って分析ができる。自社のデータ1000万件程度を抽出して分析する場合、結果が戻ってくるまでの応答時間は3秒以内である。

 これに対し1999年に構築した一世代前のシステムは、前日のデータをすぐ分析できず、担当者は翌々日まで待たなければならなかった。「すぐ分析したいという要望があったが、旧システムは、3秒という応答性能を確保するために、多くの中間ファイルを作成しており、バッチ処理に時間がかかっていた」(草留氏)。オンメモリー・データベースを使う新システムは高速処理が可能になり、中間ファイルを作るバッチ処理は原則として行わない。

三つのシステムを統合へ

 新システムを実現するために、CGCジャパンは三つのハードルを乗り越えた(図1)。オンメモリー・データベースという、実績がそれほどない技術を採用するハードル。その技術を開発したベンチャー企業に初めて発注するハードル。そして、オンメモリー・データベースを利用するためにアプリケーションを全面再構築するハードル、である。

図2●オンメモリー・データベースによるデータ統合。CGCジャパンは10億件のデータを一つのデータベースにまとめた
 CGCジャパンが統合データベースに採用したCore Saverは、処理エンジンそのものに加え、データとアプリケーションを同一サーバー上のメモリーに展開する(図2[拡大表示])。統合データベースを、64Gバイトのメモリーを搭載する64ビットIAサーバーに構築、大きく3種類の分析アプリケーションが利用できるようにした(図3)。

 新システムの統合データベース上のデータはいわゆる正規化を行った状態である。中間ファイルを作らないので、「顧客」というデータは1カ所にだけ格納されている。ただし、3秒の応答性能を確保できない可能性がある一部の処理についてだけは、中間ファイルを作成している。

 ほぼ完全に正規化した結果、新システムのデータ・サイズはこれまでより減った。メモリー上にある400日間分のデータは40Gバイト。これに対し、旧システムでディスクに格納していたデータは、60日間分で1テラ・バイトもあった。

「やり方が分からない」

 統合システムの構築を草留氏はかねてより考えていたが、「やり方が分からない」(草留氏)状態が続いていた。ITベンダーに相談すると「ハイエンドのUNIXサーバーを入れれば何とかなる」と言われてしまうが、この案は費用対効果を考えると採用できなかった。

 やり方を模索している時、流通業向け情報システムの展示会「RETAILTECH」で草留氏はCore Saverのデモンストレーションを見た。その速さに驚いた草留氏は、数理技研が公表している技術論文を読んだり、数理技研を訪ねて開発技術者からCore Saverのアーキテクチャを直接説明してもらい、「これならできる」と確信を持った。

 草留氏は上司の説得を始めた。上司を数理技研に連れて行き、システム開発会社の候補に入れる許可を取り付けた。こうして数理技研のほか、大手ベンダーを含む総勢6社が、統合システムに関する提案書をCGCグループに出した。数理技研以外の5社はオラクル製品を使う提案をしてきた。

「ベンダーが潰れたらどうするのか」

 次に「IT戦略会議」のメンバーを説得しなければならなかった。IT戦略会議は、CGCグループのシステム開発の意思決定機関で、CGCグループに加盟している食品スーパーなど10社のシステム責任者で構成されている。

 草留氏はIT戦略会議から3点について指摘された。「数理技研が倒産したらどうする」、「数理技研がCore Saverの開発を止めたらどうする」、「特殊技術であるため、専門の技術者が必要になり、開発費用が割高にならないか」である。

 草留氏は一つずつ回答していった。まず、数理技研が倒産したとしても、Core Saverの技術者は確保できるように手をうった。新システムの運用を委託する会社を選定する際、契約条件の一つに「Core Saverの技術者を育てる」という項目を入れたのである。CGCグループはシステムの開発と運用を外部に委託する方針をとっている。

 Core Saverの開発が打ち切られる可能性についてはこう説明した。「業界トップのベンダーであっても、10年前の製品の動作を保証していない」。

 開発費用については、6社から出された提案を見せて納得してもらった。総額を見ると、数理技研が最も低価格だった。ハードウエアやソフトウエア・ライセンス、新たに追加したセキュリティ対策を含めて2億円弱とみられる。セキュリティ対策とは、サーバー用指紋認証装置の設置や、情報漏えい対策保険の加入などである。

 「単純比較はできないが、これまでの三つのシステムに投資した総額と比べ、新システムの総投資額を10分の1程度に抑えられた」(草留氏)。投資額を抑えられた理由は「メモリーが安くなり、64ビットOSを搭載したサーバーが市場に普及し始めた時期だったから」(草留氏)。

 今回購入した64Gバイト・メモリー搭載の64ビット・マシンは約800万円だった。数理技研以外の5社はオラクル製品を前提にしていたため、ソフトウエアのライセンス費用がCore Saverを上回った。


続きは日経コンピュータ2006年3月6日号をお読み下さい。この号のご購入はバックナンバーをご利用ください。