●既存のDB技術と一線を画すデータ検索技術を生み出す
●ゼロベースで発想しOSの基本機能に着目
●ストップウオッチ片手に高速化を追求

庄司 渉●HOWS代表取締役副社長兼CTO
庄司 渉●HOWS代表取締役副社長兼CTO

 ソフト開発ベンチャーのHOWSが、これまでにないデータ管理・検索技術「ISSEI」を開発した。HOWSは現在、ISSEIを次世代Web基盤技術として特許を出願している。

 「ユーザー企業がデータを有効活用するためには、既存のリレーショナルデータベース(RDB)と一線を画す技術を編み出すほかないと考えた」。HOWSのCTO(最高技術責任者)である庄司渉副社長は、ISSEIを開発した思いを語る。

 ユーザー企業の多くは現在、社内システムを整備し、テキストや画像、音声などさまざまな種類のデータを大量に蓄積している。その一方で「データを業務に有効活用できていない」と嘆くCIO(最高情報責任者)が多いのも事実だ。

 その理由について庄司副社長は、「現在主流のRDBが限界に近付いているから」と述べる。「RDBを使えばデータを効率よく管理できるが、大量のデータを自由かつ高速検索できるようにするには、膨大なコストと手間がかかるといった短所もある」と指摘する。

 現行のRDBシステムで検索効率を高めるには、あらかじめ特定のデータ項目をインデックス化する必要がある。だが、ユーザー企業が最初から業務で必要なデータ項目を特定できるわけではない。インデックスを追加・変更するケースも出てくる。その場合には、改めてデータベースを見直す手間やコストがかかる。

 Web2.0時代を迎え、今後企業はさまざまなチャネルから、データを大量に収集・蓄積しなくてはならない。データがあっても、それらを素早く検索・抽出して業務に役立てなければ意味がない。

 庄司副社長は「現行のDBシステムの課題を解消するような、新たなデータ管理・検索技術を開発したいと、数年前から悶々としていた」と打ち明ける。そんなある日、そのストレスを解消するきっかけが訪れた。今春、親交のあった大手製造業のWebシステム担当者から、既存のDBシステムに関する悩みを打ち明けられたのだ。商品名や型番、価格などのデータ項目から成る、合計約110万件のデータを高速に検索できる仕組みをできるだけ安価に作れないか、という内容だった。

 「その製造業の担当者が他のITベンダーに同じ相談をしたところ、市販のRDB製品で構築するとなると数千万円かかると言われ、私のところに相談に来た」と庄司副社長は振り返る。庄司は温めていた検索技術の構想を先方に説明。その担当者は「自分たちのやりたいことが安価にできそうだ」と考え、HOWSと数百万円で契約を結んでくれた。「お金がなくてなかなか開発に踏み切れなかったが、ようやくスポンサーが付いた」。庄司副社長は今夏、後にISSEIと名付ける技術の開発に着手した。

データをすべてファイル名扱いに

 ISSEIの開発ではデータの高速検索性を最優先した。そのためにRDBとは全く異なる新たな方法でデータを管理することにした。「約30年前に開発されたRDBの設計思想に引きずられては、革新的なものは生み出せない。既存の発想にとらわれず、ゼロベースで考える」。これが開発方針だった。

 庄司副社長が目を付けていたのは、ファイル検索だ。OSの基本機能であるため、ファイル名の検索速度は速い。そこで検索対象となるファイルに含まれるデータそのものを、すべて「ファイル名」として管理することにした。具体的には、ファイルに含まれる「東京」「大阪」などのデータそのものを、62進数の文字列に変換し、それらをファイル名の集合体として別途管理する()。検索対象は、このファイル名の集合体。この方法によって、ハードディスクに保存されているファイル本体にアクセスすることなく、メモリーにキャッシュされたファイル名群を検索することで高速化を図っている。

図●HOWSが独自に開発したデータ検索技術「ISSEI」の概要
図●HOWSが独自に開発したデータ検索技術「ISSEI」の概要
OSの基本機能であるファイル名の検索機能を用いることで、ハードディスク内のファイル本体にアクセスせず高速に検索できるのが特徴だ

 従来のDBシステムでは、ディスク内のファイルに対してアクセスするのが一般的だ。「ファイルの入出力にかかる時間がボトルネックで、検索速度が上がらないとの問題を抱えていた」(庄司副社長)と言う。

 ISSEIはマイクロソフトの「VisualBasic」で開発した。庄司副社長は、「高度な関数を駆使することよりも、処理の高速性を最優先し、シンプルにコードを記述することにこだわった」と話す。庄司副社長は、プログラムが完成するたびにストップウオッチを片手に処理速度を計測したという。「自動車レースではないが、コードを修整し、時間を短縮できたときの喜びは何とも言えない。逆にうまくいかなければ、死に物狂いで考える」。庄司副社長は笑顔で語る。

 こうした結果、大手製造業のサンプルデータ約110万件のデータ検索時間は約1秒になった。この大手製造業の担当者はISSEIの出来栄えに満足したようだ。Webシステムだけでなく今後、基幹系システムにもISSEIを導入していく予定である。コクヨや日立製作所もISSEIに注目し、活用を検討している。

 「次はOSメーカーと共同開発し、ISSEIをOSの標準機能として盛り込みたい。最終的にはISSEI専用チップをメーカーと開発するのが目標だ」。庄司副社長の夢は尽きない。