2012年10月23日 から3日間、米国ニューヨークにて Strata Conference + Hadoop World 2012が開催された。Hadoopのイベントとしては、毎年6月頃に開催されるHadoop Summitと並ぶ2大イベントのうちの1つである。今回はこのイベントの様子について紹介しよう。
会場の様子
Hadoop Worldは今回が4回目の開催である。前回までは米クラウデラ主催のイベントであったが、今回は米オライリーメディアとクラウデラによる共催となった。参加者は2500人で、前回の1400人から増加した。日本の参加者は約50人で、ほぼ2011年と変わっておらず、ワールドワイドでの熱狂ぶりに比べると、日本人の関心はやや落ち着いているのかもしれない。しかしながら中国人や韓国人をはじめとする、アジア人の姿は多く見受けられた。
会場はニューヨークのヒルトンホテルで、2010年にHadoop Worldを開催した場所である。同ホテルの2階と3階全体が会場となり、セッション終了のたびに参加者が大移動していた。また、スポンサーに74社もついたこともあり、展示ブースは派手ににぎわっていた(図1)。
カンファレンス中、オライリーから出版されるHadoop関連書籍の無料配布もあった。先着順ながらも『HBase:The Definitive Guide』『HBase in Action』『Hadoop Operations』『MapReduce Design Patterns★注1』といった本が著者のサイン入りでプレゼントされた。他にもプレビュー版の本を大量に持ち帰れたのはさすがオライリー主催といったところである。
このほか「NYC Data Week」と題して、カンファレンス当日を含む数日間、各種オープンソースプロダクトのMeetup(いわゆる「オフ会」)や、ベンダーによるセミナーがニューヨーク市内各所で開催されるなど、ビッグデータ関連のイベントに染まった日々であった。
セッションの全体概要
全体的な印象としては、オライリーが主催に加わったこともあり、Hadoopそのもののイベントというよりは「ビッグデータというテーマを中心に据えたビジネスイベント」という色が強かった。セッションの内容は多岐にわたり、特に「リアルタイム処理基盤」と「データサイエンス」の2つのテーマが色濃く出ていたように思う。
10月23日はチュートリアルと呼ばれるハンズオン形式(体験型)のイベントが催された。午前午後とも1つのチュートリアル当たり3時間半の枠で実施され、Hadoop、HBase、FlumeNGといった各種プロダクトに関する話題や、PythonやR言語を用いたデータ分析手法の話題、データのクレンジングやビジュアライゼーションの話題など、実践的なチュートリアルが並んだ。
10月24日、25日の午前中はキーノートの時間に割り当てられた。スポンサーが多いこともあってか、1年で数回、他の場所で開催されるオライリー主催のStrata Conferenceと同様、1人当たりの講演が5分から15分で、講演者が次々に入れ替わるスタイルであった。1枠が短く、詳細は後程といった具合に興味を引き、後の個別セッションへ誘導する内容のプレゼンテーションが多かった。
午後のセッションは以下の7つのカテゴリーが用意され、全96セッション、8並列同時進行で行われた。カテゴリーとしては、Hadoopとその関連技術に関する枠が3カテゴリー37セッションある一方で、スポンサー枠は24セッション、それ以外も35セッションあり、ここからもHadoop一色のイベントではないことが読み取れる。
カテゴリー | 内容 | 10月24日 | 10月25日 | 合計 |
---|---|---|---|---|
Business & Industry | 「ビッグデータ」や「データサイエンス」がもたらすビジネスへのインパクトの紹介 | 4 | 6 | 10 |
Data Science | 大量のデータに相対する際のアプローチや分析手法の紹介 | 6 | 7 | 13 |
Hadoop & Beyond | Google Dremel、Couchbase、Datatomic、Metamarks、LLVM-based JIT compile on Hadoop (Akamai)、SAS、AWS、Stormなど、リアルタイム処理基盤やビッグデータ関連技術の紹介 | 6 | 6 | 12 |
Hadoop Case Studies | 農業・ヘルスケア・遺伝子解析・金融・電力・ソーシャルグラフなど、Hadoopを用いた事例の紹介 | 8 | 4 | 12 |
Hadoop: Tools & Technology | HDFS、YARN、Pig、HBaseのほか、Hadoopを用いたETL、Facebookによるモニタリングの事例など | 6 | 7 | 13 |
Sponsored | スポンサー枠 | 12 | 12 | 24 |
Visualization & Interface | 効果的に結果を見せるための描画手法やストーリーテリングの紹介 | 6 | 6 | 12 |
以下、キーノートの中でよく取り上げられ、午後のセッションの中でも注目を引いた「リアルタイム処理基盤」と「データサイエンス」という2つのキーワードに着目して、セッションを紹介する。