米トヨタのデータサイエンティストが語る、「Spark」で挑む分析の「KAIZEN」

Toyota Motor Sales, U.S.A.、データサイエンティスト、Brian Kursar氏

シリコンバレー支局

2015.06.23

　2015年6月15日から17日まで、オープンソースソフトウエア（OSS）の分散データ処理ソフトである「Spark」の開発者会議「Spark Summit 2015」が、米サンフランシスコで開催された。米IBMや米IntelといったITベンダーに並んで、スポンサーとして名を連ねていたのがトヨタ自動車である。
　トヨタの北米販売会社である米Toyota Motor Sales, U.S.A.（TMS）は2015年から、SNS（ソーシャル・ネットワーキング・サービス）上の顧客の声を分析するために、Sparkを使用している。同社はビッグデータ分析を今後も拡大する考えであり、優秀なデータサイエンティストをリクルートすることを狙い、Spark Summitに出展したという。同社のデータサイエンティストであるBrian Kursar氏（写真1）に話を聞いた。

（聞き手は中田敦＝シリコンバレー支局）

写真1●Toyota Motor Sales, U.S.A.のデータサイエンティスト、Brian Kursar氏

[画像のクリックで拡大表示]

TMSは、どのようなビッグデータ分析を実施しているのですか。

　当社は2010年から、「NoSQLデータベース（DB）」などを使用したビッグデータ分析を進めている。我々のミッションは、社内外にあるあらゆるデータを活用して、製品やサービスの品質を高めることだ。

　かつて社内のデータは、メインフレームや「DB2」「Oracle Database」「SQL Server」といったRDB（リレーショナルDB）に散在しており、全てのデータを分析に活用するのは不可能だった。しかし、NoSQL DBのような新しいテクノロジーが登場することで、拡張可能な単一のプラットフォームに全てのデータを格納し、活用できるようになった。これは我々にとって、大きなチャンスだと考えている。

　2010年に始めたのは、品質管理データやマーケティングデータの分析だ。あるベンチャー企業が開発した商用の検索ソフトを使用した。2013年にはTwitterなどのSNS上でユーザーがつぶやいたコメントを観測する「C360」というシステムを構築した。OSSの分散データ処理ソフト「Hadoop」の関連ソフトである「HBase」と、OSSの検索ソフトの「Solr」を使っている。