1990年代に考案されたRDBMSの仕組みを、現在のハードウエア性能を前提に作り直す。その観点から日立製作所は東京大学と共同で「非順序型」と呼ぶ処理方式のRDBMSを開発した。6月にこのRDBMSを搭載したアプライアンスを発売したのに続き、10月にBI機能を加えたアプライアンスが登場した。

 「新しいデータベースエンジンの検索処理性能は、従来型に比べて最大100倍に上る。従来型では200秒かかっていた2億件の検索処理が2秒で終わった」。こう語るのは、日立製作所の山口俊朗氏(情報・通信システム社 ITプラットフォーム事業本部 開発統括本部 ソフトウェア本部 ビッグデータソリューション部 担当部長)である。

 日立製作所は東京大学と共同で2010年3月に、「非順序型」*1と呼ぶ新しい処理方式によるRDBMSの研究開発を開始。2012年6月に、このRDBMSを搭載したデータウエアハウス(DWH)アプライアンスを「Hitachi Advanced Data Binder プラットフォーム*2(HADBプラットフォーム)」として製品化した。

*1 非順序実行原理は、東京大学の喜連川教授・合田特任准教授が考案した原理。
*2 内閣府の最先端研究開発支援プロジェクト「超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」(中心研究者:東京大学 喜連川教授)の成果を利用

 さらに同年10月に、独立系ITベンダーのDTSが、このDWHアプライアンスに独自のBI(Business Intelligence)ツールを加えた「Hitachi Advanced Data Binder プラットフォーム BIアプライアンス」の販売を開始した。

 DTSの横溝雅彦氏(新市場開発事業本部 新市場企画営業部 営業2G アライアンスビジネスチーム マネージャー)は「新しいRDBMSによって、BIツールで多角的に分析できる対象データの量が1~2桁増えた。夜間バッチを経ず、発生したデータをただちに分析したいというニーズにも応えられる」と話す。

従来型は非力なハードが前提

 日立製作所と東京大学が開発した非順序型のRDBMSの特徴は、SQLリクエストの処理のうち、実行順序を崩しても構わない部分を分割し並列化することにある。実行順序を崩せる部分が多い、参照系の処理を向上できる。

 従来型のRDBMSは基本的に、RDBMS上の単一プロセスが、順序立ててデータを処理していく。例えば、テーブルの結合処理の一つであるネステッドループジョインでは、「テーブルAの1レコードについて、テーブルBから条件に合うレコードを抽出する」という処理を、「テーブルAの1番目のレコードが終わったら2番目のレコードに移る」といった順序で行う。

 これは「順序型」であり、1990年代に当時のハードウエア性能を前提に作られた。非力なプロセッサーや少ないメモリー容量に対して最適化された処理の仕組みだったといえる。

 それから20年あまり経ち、ハードウエア性能は飛躍的に進歩した。特にプロセッサーとメモリーの進化が著しい。プロセッサーはマルチコア化が進み、メモリーの大容量化も顕著だ。

 一方、プロセッサーやメモリーに比べるとディスクストレージの性能向上は小さい。これは何を意味するのだろうか。一般にRDBMSのボトルネックはディスクI/Oであることが多い。ディスク性能が大幅に改善していないということは、ハードウエアの進化をRDBMSの性能向上にあまり生かせていないことになる。

 こうした状況を改善する動きもあった。従来型のRDBMSはマルチスレッド化を図ってきたが、基本は単一プロセスによる順序立てた処理で、「多重度の上限はDBサーバーのプロセッサー数で決まる」といった制約がある。従来型のRDBMSは、プロセッサーやメモリーに余力があるのに性能向上しづらい状況が続いていた(図1)。

図1●DBサーバーおよびディスクの進化と問題
従来型のRDBMSは、約20年前のハードウエア性能をベースに考えられたもの。日立製作所は東京大学と共同で、現在のハードウエア性能に適したRDBMSを開発した
[画像のクリックで拡大表示]

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。