「マウス」や「タッチパネル」ではなく、人工知能(AI)を備えた会話ロボット(ボット)との対話こそが、ユーザーインターフェース(UI)の主役になる――。米MicrosoftのSatya Nadella CEO(最高経営責任者)は2016年3月30日に開催したイベント「Build 2016」で、会話ロボットを実現するAIクラウドなどを発表した(写真1)。

写真1●米MicrosoftのSatya Nadella CEO(最高経営責任者)
写真1●米MicrosoftのSatya Nadella CEO(最高経営責任者)
[画像のクリックで拡大表示]

 Microsoftが30日のイベントで発表した目玉は二つ。一つはNadella CEOが「Conversations as a Platform(プラットフォームとしての会話)」と呼ぶ、会話ロボットを実現するためのAIクラウド。もう一つは、Windows OSにとっての最大のライバルである「Linux」の機能を丸ごとWindowsに取り込んでしまう「Windows Subsystem for Linux」と呼ぶ機能の発表だ。

音声/画像認識機能のクラウドサービスを提供

 現在、スマートフォンやタブレットには、「iOS」であれば「Siri」、「Android」であれば「Google Now」、Windowsであれば「Cortana」といった具合に、ユーザーと音声で会話をするアシスタント機能が搭載されている。今後はデバイスだけでなく、様々なアプリケーションやWebサイトなどにも、こういったボットが搭載されるようになり、ユーザーはUIをあれこれ操作しなくても、自分のやりたいことをアプリに会話で伝えれば済むようになるというのが、Nadella CEOの見立てだ。

 Microsoftはユーザー企業がAIを備えたボットを簡単に開発できるように、AIのクラウドサービスなどを提供していく。その一つが、画像認識や音声認識などの機能をクラウドのサービスとして提供する「Microsoft Cognitive Services」だ。

 ユーザー企業はクラウドが備えるAPI(アプリケーション・プログラミング・インターフェース)を呼び出す簡単なコードを記述するだけで、音声を認識したり画像を認識したりするAIの機能を、自社のアプリケーションに組み込めるようになる。

 例えば画像関連では画像中の被写体を認識する「Computer Vision API」や人の感情を認識する「Emotion API」、人物を認識する「Face API」などを、音声関連では音声をテキストに変換する「Speech API」や話し手を認識する「Speaker Recognition API」を、言語関連では文章の意味を認識する「Text Analytics API」などを提供する。

IBMの「Watson」の競合サービス

 Microsoft Cognitive Servicesは、音声認識などAIの様々な機能をクラウドのサービスとして提供するという点で、米IBMの「Watson Developer Cloud」や、米Googleが2016年3月に発表した「Google Cloud Machine Learning」と同じだ。