2015年6月15日から17日まで、オープンソースソフトウエア(OSS)の分散データ処理ソフトである「Spark」の開発者会議「Spark Summit 2015」が、米サンフランシスコで開催された。米IBMや米IntelといったITベンダーに並んで、スポンサーとして名を連ねていたのがトヨタ自動車である。
 トヨタの北米販売会社である米Toyota Motor Sales, U.S.A.(TMS)は2015年から、SNS(ソーシャル・ネットワーキング・サービス)上の顧客の声を分析するために、Sparkを使用している。同社はビッグデータ分析を今後も拡大する考えであり、優秀なデータサイエンティストをリクルートすることを狙い、Spark Summitに出展したという。同社のデータサイエンティストであるBrian Kursar氏(写真1)に話を聞いた。

(聞き手は中田 敦=シリコンバレー支局)
写真1●Toyota Motor Sales, U.S.A.のデータサイエンティスト、Brian Kursar氏
写真1●Toyota Motor Sales, U.S.A.のデータサイエンティスト、Brian Kursar氏
[画像のクリックで拡大表示]

TMSは、どのようなビッグデータ分析を実施しているのですか。

 当社は2010年から、「NoSQLデータベース(DB)」などを使用したビッグデータ分析を進めている。我々のミッションは、社内外にあるあらゆるデータを活用して、製品やサービスの品質を高めることだ。

 かつて社内のデータは、メインフレームや「DB2」「Oracle Database」「SQL Server」といったRDB(リレーショナルDB)に散在しており、全てのデータを分析に活用するのは不可能だった。しかし、NoSQL DBのような新しいテクノロジーが登場することで、拡張可能な単一のプラットフォームに全てのデータを格納し、活用できるようになった。これは我々にとって、大きなチャンスだと考えている。

 2010年に始めたのは、品質管理データやマーケティングデータの分析だ。あるベンチャー企業が開発した商用の検索ソフトを使用した。2013年にはTwitterなどのSNS上でユーザーがつぶやいたコメントを観測する「C360」というシステムを構築した。OSSの分散データ処理ソフト「Hadoop」の関連ソフトである「HBase」と、OSSの検索ソフトの「Solr」を使っている。

ビッグデータ分析にはOSSを優先的に使用

 ここに至る間に、我々は二つのことを学んだ。一つは、ビッグデータ分析のプラットフォームにはOSSを使うべきということ。もう一つは、SNSのデータを活用するのはなかなか難しいということだ。