2012年10月23日 から3日間、米国ニューヨークにて Strata Conference + Hadoop World 2012が開催された。Hadoopのイベントとしては、毎年6月頃に開催されるHadoop Summitと並ぶ2大イベントのうちの1つである。今回はこのイベントの様子について紹介しよう。

会場の様子

 Hadoop Worldは今回が4回目の開催である。前回までは米クラウデラ主催のイベントであったが、今回は米オライリーメディアとクラウデラによる共催となった。参加者は2500人で、前回の1400人から増加した。日本の参加者は約50人で、ほぼ2011年と変わっておらず、ワールドワイドでの熱狂ぶりに比べると、日本人の関心はやや落ち着いているのかもしれない。しかしながら中国人や韓国人をはじめとする、アジア人の姿は多く見受けられた。

 会場はニューヨークのヒルトンホテルで、2010年にHadoop Worldを開催した場所である。同ホテルの2階と3階全体が会場となり、セッション終了のたびに参加者が大移動していた。また、スポンサーに74社もついたこともあり、展示ブースは派手ににぎわっていた(図1)。

図1●展示ブースの様子
図1●展示ブースの様子
[画像のクリックで拡大表示]

 カンファレンス中、オライリーから出版されるHadoop関連書籍の無料配布もあった。先着順ながらも『HBase:The Definitive Guide』『HBase in Action』『Hadoop Operations』『MapReduce Design Patterns★注1』といった本が著者のサイン入りでプレゼントされた。他にもプレビュー版の本を大量に持ち帰れたのはさすがオライリー主催といったところである。

注1 日本でオライリーから発売されている『Hadoop MapReduce デザインパターン MapReduceによる大規模テキストデータ処理』の原著とは別物

 このほか「NYC Data Week」と題して、カンファレンス当日を含む数日間、各種オープンソースプロダクトのMeetup(いわゆる「オフ会」)や、ベンダーによるセミナーがニューヨーク市内各所で開催されるなど、ビッグデータ関連のイベントに染まった日々であった。

セッションの全体概要

 全体的な印象としては、オライリーが主催に加わったこともあり、Hadoopそのもののイベントというよりは「ビッグデータというテーマを中心に据えたビジネスイベント」という色が強かった。セッションの内容は多岐にわたり、特に「リアルタイム処理基盤」と「データサイエンス」の2つのテーマが色濃く出ていたように思う。

 10月23日はチュートリアルと呼ばれるハンズオン形式(体験型)のイベントが催された。午前午後とも1つのチュートリアル当たり3時間半の枠で実施され、Hadoop、HBase、FlumeNGといった各種プロダクトに関する話題や、PythonやR言語を用いたデータ分析手法の話題、データのクレンジングやビジュアライゼーションの話題など、実践的なチュートリアルが並んだ。

 10月24日、25日の午前中はキーノートの時間に割り当てられた。スポンサーが多いこともあってか、1年で数回、他の場所で開催されるオライリー主催のStrata Conferenceと同様、1人当たりの講演が5分から15分で、講演者が次々に入れ替わるスタイルであった。1枠が短く、詳細は後程といった具合に興味を引き、後の個別セッションへ誘導する内容のプレゼンテーションが多かった。

 午後のセッションは以下の7つのカテゴリーが用意され、全96セッション、8並列同時進行で行われた。カテゴリーとしては、Hadoopとその関連技術に関する枠が3カテゴリー37セッションある一方で、スポンサー枠は24セッション、それ以外も35セッションあり、ここからもHadoop一色のイベントではないことが読み取れる。

表1●セッション全体の概要とセッション数
カテゴリー 内容 10月24日 10月25日 合計
Business & Industry 「ビッグデータ」や「データサイエンス」がもたらすビジネスへのインパクトの紹介 4 6 10
Data Science 大量のデータに相対する際のアプローチや分析手法の紹介 6 7 13
Hadoop & Beyond Google Dremel、Couchbase、Datatomic、Metamarks、LLVM-based JIT compile on Hadoop (Akamai)、SAS、AWS、Stormなど、リアルタイム処理基盤やビッグデータ関連技術の紹介 6 6 12
Hadoop Case Studies 農業・ヘルスケア・遺伝子解析・金融・電力・ソーシャルグラフなど、Hadoopを用いた事例の紹介 8 4 12
Hadoop: Tools & Technology HDFS、YARN、Pig、HBaseのほか、Hadoopを用いたETL、Facebookによるモニタリングの事例など 6 7 13
Sponsored スポンサー枠 12 12 24
Visualization & Interface 効果的に結果を見せるための描画手法やストーリーテリングの紹介 6 6 12

 以下、キーノートの中でよく取り上げられ、午後のセッションの中でも注目を引いた「リアルタイム処理基盤」と「データサイエンス」という2つのキーワードに着目して、セッションを紹介する。