「今の時点で、ビッグデータで何が変わるのだろうと考えているとしたら、危機感を持ってほしい」。分散バッチ処理ソフトのHadoopおよびHadoopディストリビューション「Cloudera's Distribution including Apache Hadoop」を掲げ、ビッグデータを活用したシステム構築を促進するNTTデータ 基盤システム事業本部 シニアエキスパートの濱野 賢一朗氏に、ビッグデータ活用の重要性について聞いた。

(聞き手は田島 篤=ITpro

そもそもHadoopおよびビッグデータに着目した理由は。

NTTデータ 基盤システム事業本部 システム基盤サービスビジネスユニット OSSプロフェッショナルサービス シニアエキスパート 濱野 賢一朗氏
NTTデータ 基盤システム事業本部 システム基盤サービスビジネスユニット OSSプロフェッショナルサービス シニアエキスパート
濱野 賢一朗氏

 これまでを振り返ってみると、企業戦略としてのビッグデータ活用が最初からあったわけではない。「大量のデータを蓄積して解析したい」という顧客からの要望が、Hadoopおよびビッグデータに取り組むきっかけだった。

 2007年ごろ、テレコム系のある顧客から、大量のログを蓄積して活用することで、新たなサービスを創出したいという要望があった。その要望に応えようとしたときに、ペタバイト(ペタは1000兆)クラスのデータをリーズナブルに蓄積・解析できる基盤として、顧客と一緒になって見つけてきたのがHadoopだった。Hadoopは、ビッグデータ活用ありきではなく、ログの解析という現実問題を解決するために探し出してきた道具という位置付けだった。

 このように、使い始めた当時のHadoopは、特定顧客の要望に応えるための道具という位置付けだったが、2年も経たないうちに、メディア、流通、金融といったさまざまな業種の顧客から類似するシステムの要望がくるようになった。こうした動きが、今ではひとくくりにまとめられている「ビッグデータ活用」につながっていると認識している。

2007年ごろにHadoopを使うことに不安はなかったのか。

 その当時にHadoopを使うのは挑戦ではあったが、Hadoopをめぐる動きを見ていてこれから成長しそうだという感触はつかんでいた。

 確かに、ミドルウエアは枯れていないと使えないという意見もあるとは思う。それでも、長年オープンソースソフトウエア(OSS)を活用していると、たとえ未成熟なソフトウエアであっても、構築・運用などインテグレーションの工夫次第で、安全に使えることが分かっていた。そのため、多少背伸びをした感はあったが、Hadoopを採用することにした。

クラウドとビッグデータの関係をどのように位置付けているのか。

 クラウドをどう定義するかにもよるが、IaaSとかPasS、SaaSという見方とは別に、「リーズナブルに使える分散処理基盤」というようにクラウドを捉えることもできるだろう。

 近年、CPUの処理性能向上に加えて、メモリーとネットワークの価格性能比が上がってきた。これにより分散処理基盤、言い換えれば計算リソースのクラウド化が実現しつつある。このクラウド化された大規模なリソースを利用することで、従来は扱いづらかったビッグデータをリーズナブルに蓄積して分析し、活用できるようになったと捉えている。

具体的なビッグデータ活用事例を教えてほしい。

 公表している事例は三つある。一つは、国立国会図書館(NDL=National Diet Library)の検索サービス。この国立国会図書館サーチ(NDL Search)は、国会図書館をはじめ、全国の図書館や公文書館などの蔵書を横断的に検索できる。

 二つ目はKDDIの事例だ。通信系のログを蓄積して解析し、サービス改善などに活用している。

 三つ目がリクルートの事例である。例えば、グルメ情報やクーポンを掲載する「ホットペッパー グルメ」では大量のアクセスログデータが生成されており、それらを使ってインターネット上でのサイト誘導や、購買に対するリスティングやバナー広告などの集客施策がどれだけ事業に貢献したかを分析している。

ビッグデータ活用の本質的な価値はどこにあるのか。

 「ビッグデータって何なのか」、「ビッグデータってどこに価値はあるのか」とよく聞かれる。その答えを知るために、従来のデータ活用と対比してみよう。

 従来のデータ活用においては、情報をサマライズした状態で捉えれば、ある程度はビジネスにフィードバックできるという観点でシステムを作っていた。大局な動きを捉えたうえで、もう一歩ぐらいドリルダウンできればよいという感覚だったといえる。

 一方、ビッグデータ活用は、1件1件のデータに意味があるというところから始まっている。1件のデータには深い意味がある、それをどう扱うかに価値を見出すわけだ。

1件1件のデータの価値を生かしてこそ、意味があると。

 一つひとつのデータに価値を見出してこそ、それらの総体であるビッグデータを事業で戦略的に活用できる。言い方を変えれば、ビッグデータ活用は事業戦略と密接に関係する。対外的に事例を公表しづらいのはこのためだ。

 「ビッグデータって何の役に立ちますか」「ビッグデータって具体的にどのような内容ですか」と個別に問われると、これらの答えは、事業戦略あるいは企業戦略そのものになる。そのため、具体的な事例はなかなか表に出てこない。しかしながら、すでに多くの企業がビッグデータ活用の価値に気付いていて、着々と準備を進めている。

 今の時点で、ビッグデータで何が変わるのだろうと考えているとしたら、危機感を持ってもらった方がよい。もしかすると、同業他社はすでに、どのデータにどのような価値があるかを判別して貯め始め、次に展開する新たなビジネスに活かそうとしているかもしれないからだ。