リアルタイムに時々刻々と生成される大量のデータから、いかに知見を見いだしてビジネス戦略に生かすか――。ビッグデータ活用が情報システムのあり方と企業戦略を大きく変えようとしている。米MicrosoftでSQL Serverを担当する Shawn Bice氏と、日本マイクロソフト エグゼクティブプロダクトマネージャーの上田 健氏に、米国でのビッグデータ活用とSQL Serverの新機能について聞いた。

(聞き手は田島 篤=ITpro

Microsoftが考えるビッグデータとは何か。

Microsoft SQL Server Database Systems General Manager Shawn Bice氏
Microsoft SQL Server Database Systems General Manager
Shawn Bice氏

(Bice)ビッグデータという言葉は米国においてもバズワード的に広く使われている。IT業界に大きな変革の波が来ているからだ。

 大きなトレンドとして現在進行中なのは、「データが爆発的に増えていること」である。非常に多くの、そして非常に多様な種類のデータが生成されている。なぜなら、データの生成方法が変わってきたからだ。従来は、人がシステムにデータを入力していた。現在は、多彩なデバイス、例えばスマートフォンやデジタルカメラ、各種センサーなどから自動的にデータが生成されるようになっている。

 こうした状況の中でユーザー企業は、あらゆる種類のデータを保持し、それを分析して洞察を引き出したいというニーズを高めている。ビッグデータ活用は、ボリューム(Volume=量)、バラエティ(Variety=種類)、ベロシティ(Velocity=頻度)という三つの特徴を備えたデータを素早く分析することだが、その意味合いはユーザー企業ごとに異なるだろう。

ビッグデータで注目を集める「Apache Hadoop」(以下、Hadoop)をどう見る。

 Hadoopは、コモディティ化した安価なハードウエア上で、分散型のファイルシステムHDFSとMapReduceソフトウエアを利用できる技術である。MicrosoftはHadoopに対抗する意識は全くない。むしろ、Hadoopを取り込もうと考えている。

 そこでMicrosoftは、Hadoopに関連した二つの製品を提供する予定である。一つは、Windows Azure上で動作するHadoop。既に特定の顧客に対してプレビュー版の提供を開始している。もう一つは、オンプレミスでWindows ServerやSQL Serverが利用できるHadoopディストリビューションである。こちらも先行ユーザーからフィードバックをもらっている段階だ。

 ユーザー企業のITプロフェッショナルやCIOが望んでいるのは、“Enterprise Ready”のHadoopである。Active DirectoryやSystem Centerでアカウントや運用を一元管理できる、信頼性の高いHadoop製品が求められている。この要望に応えるために準備を進めている。

 Hadoopは素晴らしい技術だと思うが、まだまだそのライフサイクルの初期の段階にある。Hadoopの企業利用を加速するためには、Active DirectoryやSystem Centerへの対応が必要で、これができるのはMicrosoftだけである。

SQL Server 2012について聞きたい。ビッグデータに対応するためにどのような機能を追加するのか。

日本マイクロソフト サーバープラットフォームビジネス本部 エクゼクティブプロダクトマネージャー 上田 健氏
日本マイクロソフト サーバープラットフォームビジネス本部 エクゼクティブプロダクトマネージャー
上田 健氏

(上田)一つは、爆発的に増えているデータの分析を企業が簡単に行えるようにする機能「PowerView」である。多様なソースからデータを取り込んで分析し、ビジュアルに表示できる機能だ。特にデータのビジュアル化のために多くの開発を行った。ビジュアル化された分析結果から多大な洞察が得られ、それをベースにした意思決定ができるようになる。

 もう一つは、単一のアーキテクチャでオンプレミスからクラウドまで展開できることだ。膨大なデータにオンプレミスで対応するのも一つのアプローチではある。しかしながら、データを集めて、処理して、活用するということでは、クラウド化がどうしても避けられない。

(Bice)顧客が望んでいるのは、簡単にオンプレミスからクラウドに移行できることである。Microsoftのアプローチは、既存のオンプレミスのシステムを非常に簡単にクラウドに持っていけるようにする。ユーザー企業のニーズに応じて、オンプレミスでもクラウドでも、シームレスあるいはハイブリッドに対応できる。

SQL Server 2012を使えばデータサイエンティストは不要なのか。

 米企業には、データサイエンティストと呼ばれる人たちがいる場合が多い。これを踏まえてSQL Server 2012は、三つの領域を対象にしている。一つめは、非構造化データでも構造化データでも処理できること。二つめがBI(ビジネスインテリジェンス)。データを処理して洞察力を高められるようにする。三つめがデータサイエンティストの領域である。SQL Server 2012では、現場が使える「PowerView」だけでなく、データサイエンティスト向けの機能も提供する。