写真1●マイクロソフトリサーチアジアで技術戦略担当のシニアディレクターを務める張益肇(エリック チャン)氏
写真1●マイクロソフトリサーチアジアで技術戦略担当のシニアディレクターを務める張益肇(エリック チャン)氏
[画像のクリックで拡大表示]
写真2●文字で「sydny opera」を入力、さらにギザギザをスケッチして検索すると、特徴的な屋根を持つシドニー・オペラハウスの画像が出力される
写真2●文字で「sydny opera」を入力、さらにギザギザをスケッチして検索すると、特徴的な屋根を持つシドニー・オペラハウスの画像が出力される
[画像のクリックで拡大表示]
写真3●翻訳サービス「Bing Dictionary」について解説する荒瀬由紀 副研究員
写真3●翻訳サービス「Bing Dictionary」について解説する荒瀬由紀 副研究員
[画像のクリックで拡大表示]
写真4●手持ちで撮影した動画のブレをソフトウエア処理でなくす技術「Video Stavilization」を説明する松下康之 主席研究員
写真4●手持ちで撮影した動画のブレをソフトウエア処理でなくす技術「Video Stavilization」を説明する松下康之 主席研究員
[画像のクリックで拡大表示]

 マイクロソフトの基礎研究開発機関であるマイクロソフトリサーチアジア(MSRA)は2012年5月24日、研究開発活動の一部を公開した。主に五つの分野に焦点を当てて研究開発を進めており、産学共同の活動も活発だという(関連記事)。手描きのスケッチから画像を検索する技術や、膨大なデータを活用した機械翻訳技術、クラウドを活用した翻訳技術などを公開した。

 技術戦略担当シニアディレクターの張益肇(エリック チャン)氏は、「MSRAは、ナチュラル・ユーザーインタフェース、データインテンシブ・コンピューティング、マルチメディア、コンピュータサイエンス全般の基礎研究、検索技術という五つの分野に焦点を当てて研究開発活動を行っている」(写真1)。これらの分野において、研究者たちは社会や顧客の役に立ちそうであれば、自由に研究テーマを選べるという。

 同氏はこうした研究活動の一例として、10億(1ギガ)ピクセルの画像を撮影できるカメラを4年以上かけて開発、それを用いて敦煌の洞窟の壁画を詳細な画像データとして保存していることを紹介した。「開発者の情熱が、文化遺産の保存という社会貢献につながっている」という。

 続いて、今後に世の中の役に立ちそうな研究開発中の技術として、手描きのスケッチから画像を検索できる「MindFinder」を紹介した。中央に○をスケッチしたら月の画像を検出する、二つの○を描いてそれらを▽でつないだら自転車を検索するといった具合だ。また、文字と組み合わせることで、検索精度を高めることも可能である(写真2)。教育分野やEC分野での活用が期待できるという。

 翻訳サービスの「Bing Dictionary」は、Web上の膨大なデータを活用して、入力した単語の意味と例文を表示する。MSRAに在籍する5人の日本人研究者の一人、荒瀬由紀 副研究員の成果が反映されたものだ(写真3)。中国語と英語の機械翻訳機能、検索機能を組み合わせることで、高品質の情報を表示できるという。また、音声での検索も可能だ。すでに、Bing Chinaの機能に組み込まれている。いずれ日本語も扱えるようにしたいという。

 同じく日本人研究者の一人である松下康之 主席研究員は、手持ちで撮影した動画のブレをソフトウエア処理でなくす技術「Video Stavilization」を説明した(写真4)。「プロとアマチュアの動画品質の大きな違いの一つが、手ブレの有無。この傾向は、撮影に用いるデバイスが小さくなって解像度が高まるにつれ、顕著になる」という。この手ブレをなくすために、ソフトウエア処理だけで各フレーム間のつながりをスムーズにする技術を開発した。動画サイズの縮小や、Webからダウンロードしてきた動画の品質向上に役立つという。この技術は、Windows 8のAPI(アプリケーション・プログラミング・インタフェース)として実装され、「ムービー メーカー」でも使われるという。

 このほか、カートゥーン作成支援システムや、クラウドを活用して会話をリアルタイムで翻訳する技術、ビッグデータを活用した都市交通システムなどが公開された。