オープンソースソフトウエア(OSS)の分散データ処理ソフト「Hadoop」を使ったシステム構築やサポートの事業を手がけるNTTデータ。そんな同社が現在、Hadoopのサポート企業から「開発企業」へと変わり始めている。Hadoopのソースコード開発に関する貢献を増やし、Hadoopの「コミッター」を自社から輩出することを目指す。

 「Hadoopの開発そのものに、今まで以上に足を突っ込むことに覚悟を決めた」。NTTデータの濱野賢一朗氏は、同社のHadoopに関するスタンスをこのように表現する。NTTデータは2010年7月から、Hadoopを使ったシステム構築・運用支援サービスを手がけている。NTTデータは当初、Hadoopのディストリビューション(検証済みパッケージ)のベンダーである米クラウデラと提携し、サポートを提供していた。例えば、ユーザー企業からHadoopに関するバグ修正などの要望が生じた場合は、クラウデラに実際の修正作業などを依頼していた。それを「クラウデラに必ずしも頼らなくても、最後まで顧客に改善を約束できる体制をNTTデータだけで作る」(濱野氏)という。

 NTTデータが方針を切り替えたのは、クラウデラや米ホートンワークスといったHadoopのディストリビューションベンダーが、最近は「Hadoop 2」の開発に専念しているためだという。Hadoop 2は2013年10月に正式版がリリースされた新世代のHadoopで、新しいクラスター管理機構である「YARN」を搭載することで、バッチ処理以外の様々な処理方式に対応できるようになった。

 ディストリビューションベンダーはHadoop 2の開発に力を入れる一方で、従来のHadoop、つまりYARNを使わないHadoopのことを「Traditional Hadoop」と呼び、Traditional Hadoopに対する性能改善や機能追加を、ほぼ止めてしまったのが実情だ。しかし「今後も既存のHadoopを使い続けるユーザー企業は多い」(濱野氏)。そこで、ディストリビューションベンダーに代わってNTTデータが、Traditional Hadoopのメンテナンスをしていく考えなのだという。

Hadoopコミッターの輩出も目指す

 具体的には、NTTデータ社内やNTTグループの研究所である「NTTソフトウェアイノベーションセンタ」の中に、Hadoop開発に従事するエンジニアを育成する。そしてユーザー企業から改善要望などがあった場合に、NTTデータだけでHadoopの修正パッチを開発できるようにする。さらにそれだけでなく、米Apacheソフトウエア財団(ASF)においてHadoopなどのソースコードを変更する権限を持つ「コミッター」も、NTTデータから輩出することを目指す。