2011年に米国で創業したベンチャー企業が提供するビッグデータ向けクラウドサービス。現在80社以上の企業に利用され、データ量は月間5000億件ペースで増加しているという。Treasure Dataの田村氏がサービスの特徴と構造を解説する。

 Treasure Data Platformはビッグデータの分析基盤を提供するクラウドサービスである。大量データを収集して保管し、そのデータに対してクエリー処理を行う機能を備える。目指しているのは、エンジニアがより効果的に時間を使えるようにすることだ。

 ビッグデータ分析では膨大なデータを管理するだけでも手間がかかる。また、膨大なデータを短時間で分析する方法の一つとしてHadoopがよく利用されるが、Hadoopの運用・保守は容易ではない。つまり、本来やりたい「データ分析」以外に多くの時間が必要なのだ。Treasure Dataのサービスを使えば、そうした手間を減らせる。

Treasure Dataの三つの特徴

 Treasure Dataの特徴は、「スキーマレスなデータモデル」「Hadoopのスペシャリスト不要」「スモールスタートが可能で、月ごとの課金」の3点にまとめられる(図1)。順番に説明する。

図1●Treasure Dataのサービスの特徴
図1●Treasure Dataのサービスの特徴
[画像のクリックで拡大表示]

スキーマレスなデータモデル

 一つめの特徴は、データモデルがスキーマレスであることだ。Treasure Dataは基本的なデータ構造としてJSON(JavaScript Object Notation)形式を採用している。データ型をあらかじめ設定する必要がなく、任意のカラムを加えたり削ったりできる。

 なぜスキーマレスであることが重要なのか。多くのエンジニアが企業システムで使ってきたRDBMSをベースに説明しよう。