分散クラスターでのビッグデータ分析をインメモリーで高速に行うオープンソースソフトウエア(OSS)の「Spark」。その開発の中核を担う企業が米Databricksだ。Sparkを開発した米University of California Berkeley(UCB)の研究組織「AMPLab」からスピンアウトして、2013年に設立されたベンチャー企業である。

 同社の事業内容はあまり明らかになっていなかったが、2014年6月に開催したSparkのイベント「Spark Summit 2014」を機に、Sparkを手軽に利用できるようにするためのクラウドサービス「Databricks Cloud」を投入したり(関連記事:高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始)、Hadoopディストリビューションベンダーと相次いで提携したりするなど(関連記事:次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム)、会社設立直後のステルスモードから脱し、事業活動が本格化してきた。

 Sparkの主要開発者の一人で、Databricksの共同創業者であるPatrick Wendell氏(写真)に、同社の現状とSparkの今後の方向性について聞いた。(聞き手は進藤 智則=日経コンピュータ

まずDatabricksの概要や人員構成について教えてほしい。

写真●Databricks共同創業者のPatrick Wendell氏。2014年7月に開催された「Hadoop Conference Japan 2014」での講演のため、青色の法被を着ている
写真●Databricks共同創業者のPatrick Wendell氏。2014年7月に開催された「Hadoop Conference Japan 2014」での講演のため、青色の法被を着ている
[画像のクリックで拡大表示]

 2013年に設立された企業で、現在は25人ほどの従業員がいる。このうち23人がエンジニアだ。彼らがSpark本体やそのライブラリ、クラウドサービスの開発などに従事している。ただ、人員は急速な勢いで増えている。当社はベンチャーキャピタルからシリーズA~Bの出資を受けており、陣容を拡大するための資金は豊富だ。

 CEO(最高経営責任者)は、UCBの教授であるIon Stoica氏が務めている。シリコンバレーでは大学教授がスタートアップを設立することは日常的であり、その場合、大学での仕事は一時休止し、産業界での仕事に専念する。Stoica氏もそうだ。CTO(最高技術責任者)は、Sparkの創始者であるMatei Zaharia氏が務めている。

 CEOのStoica氏は、CTOのZaharia氏およびUCBの4人の学生・教授らとともに当社を設立した。そのうちの一人が私だ。私は当時、UCBの博士課程に在籍していたが、研究活動を中止してDatabricksに加わった。

 エンジニア以外には、ビジネスデベロプメントやセールスを担当する人間が若干名、在籍している。マーケティング部門については今、最適な人材を探しているところだ。

Databricksのビジネスモデルは何か。既に売り上げも立っているのか。

 当社は主に二つの領域に注力している。一つは、SparkをOSSとして成功させることだ。Sparkを分散クラスターでのビッグデータ分析のデファクトスタンダードにしたいと思っている。そのために当社は、米Clouderaや米MapR TechnologiesといったHadoopディストリビューションベンダーと提携した。提携に当たり、こうした企業から契約料などを受け取っており、現時点ではそれらが売り上げにもなっている。ただし、この提携の目的はSparkをOSSとして普及させることが目的であり、パートナー企業から売り上げを得ることが主目的ではない。

 もう一つの領域は、Sparkを使ったクラウドサービス「Databricks Cloud」の提供だ。長期的にみた場合、こちらが当社の主力製品分野であり、売り上げを獲得するためのメイン手段となる。現状では、Spark Summitといったイベントの開催などでも若干の売り上げを得ているが、長期的にはクラウドサービスによってマネタイズしていく戦略だ。