人工知能の最新トレンドであるDeep Learningを、取り入れたビジネスが拡大している。その中で、「Convolutional Neural Networks」という技法は、イメージ解析に最適であることが、様々なベンチマークで証明されてきた。コンピューターの“視覚”が劇的に進化し、ここに大きなビジネスチャンスが生まれている。

テキストやイメージを高精度で認識・解析

 この分野で注目を集めているベンチャーは、シリコンバレーに拠点を置く「MetaMind」で、企業向けに人工知能ソリューションを提供する。人工知能は「AI Platform」として提供され、テキストやイメージを高精度で認識・解析する。MetaMindが提供する主要機能は、「Language」と「Vision」。前者は自然言語解析エンジンで、財務諸表などを理解し、リスクを査定する。後者はイメージ認識(Image Prediction)エンジンで、イメージとして写っているオブジェクトを2万2000の区分に分類する。

出典: MetaMind
出典: MetaMind
[画像のクリックで拡大表示]

 上の写真がVisionの機能で、写真に写っているオブジェクトを分類する。左側は入力したイメージで、右側がその解析結果である。イメージ認識機能は、写真はTabby Cat(トラネコ)と正しく認識している。解答には、解答候補と自信度が表示される。Tabby Catの自信度は25%で、Egyptian Cat(エジプシャンマウ)は23%。判定の難しさがうかがい知れる。動物や植物の種類を言い当てるのは、たとえ人間でも専門知識が必要で、非常に難しい。