クラウド、センサー、スマートフォン、大容量の記憶装置…。さまざまな技術の発展が相まって、「ビッグデータの時代」が到来しつつある。「ビッグデータの時代にはパターン認識の技術が生きる」。こう語るのは、NTTドコモの栄藤 稔サービス&ソリューション開発部 部長。栄藤氏は音声認識、文字認識、画像認識、全文検索処理の基盤となるパターン認識技術の研究者であり、同社が提供するクラウドサービスの開発面での責任者でもある。研究と事業化の両方を知る立場の栄藤氏に、ビッグデータ時代の到来が、パターン認識技術と商用サービスにどう影響を及ぼすのかを聞いた。

(聞き手は高下 義弘=ITpro

栄藤さんはビッグデータ時代の到来により、パターン認識技術が各所で生きてくる、とおっしゃっています。

写真●NTTドコモの栄藤 稔サービス&ソリューション開発部 部長
写真●NTTドコモの栄藤 稔サービス&ソリューション開発部 部長

 例えば最近のデジカメが搭載している顔の自動追尾。これはパターン認識技術が裏にあるのですが、10年前なら民生機での実現などまず考えられなかった。それが可能になったのは、アルゴリズムの確立はもちろん、アルゴリズムの性能アップに欠かせないデータの量が増えたからです。

 パターン認識は大まかにいえば、大量のデータから何らかの意味を見いだす技術です。画像認識や音声認識、文章解析などといったパターン認識のエンジン、それから機械学習のフレームワークが確立できれば、あとはそこに投入するデータ量の勝負です。ですので、パターン認識の分野ではしばしば、「データはパワーである」と言います。認識処理に使えるデータの量が増えれば増えるほど、アルゴリズムの性能、つまり認識の精度は指数関数的に高まるからです。

 最近はソーシャルメディアによる消費者自身の情報発信、それからセンサーとネットワーク技術の発達により、さまざまな種類のデータが容易に取得できるようになりました。加えてハードウエア技術の進歩により、大量のデータを前よりも短時間で解析できるようになってきています。

 これまで研究レベルにとどまっていたアルゴリズムを、実際のデータを使って検証し、磨く。そしてデータで磨いたアルゴリズムを使って、便利なアプリケーションを実現する。そんなことがビッグデータ時代の到来により可能になってきたのです。

今後はどんなアプリケーションが可能になりそうですか。

 画像認識の分野について言えば、物体の識別処理です。例えば、目の前の食事をデジカメで撮ると、それがどんな料理なのか、どんな材料が使われているのかをコンピュータ側が自動で認識する。食事の画像から自動的にカロリーを計算して健康管理に役立てる、といったアプリケーションが実現できるようになります。実際、foo.log(フー・ドット・ログ)という会社が開発しているサービス「FoodLog」が同種のアプリケーションを実用化レベルに持っていこうとしています。

 物体の識別処理は技術的には顔認識よりも難しいのですが、インプットとなる画像のデータ量が増えれば、アルゴリズムの性能が高められます。商用サービスのユーザーが増えれば、手に入れられるデータの量が増大するため、ますますアルゴリズムの正確性が高まることでしょう。