東京ビッグサイトで2016年10月19日から21日まで開催されている「ITpro EXPO 2016」で、AI insideマーケティングはAI(人口知能)を利用した文字の読み取りサービスを紹介している。従来のOCR(Optical Character Recognition)サービスでは読み取れなかった手書き文字も、99.89%と高い精度で読み取れるようになる。手書きの書類や文章をデータ化するキーボード作業を省いたり、ビッグデータ処理に利用したりできる。

AI insideマーケティングの出展ブースの様子
AI insideマーケティングの出展ブースの様子
[画像のクリックで拡大表示]

 同社の提供するサービスは、高精度画像認識と自然言語処理の仕組みを組み合わせて文字認識している。画像認識ではディープラーニング(深層学習)を活用し、大量の手書き文字データを学習することで識別精度を高めた。そこに自然言語の規則を当てはめることで高い精度を確保する。同社代表取締役の永田純一郎氏は、「文字認識技術の中では、業界の中でトップレベルの精度だ」という。これまでのOCRでは、手書き文字の認識精度は2~6割しか読めなかった。

従来のOCRとAI insideマーケティングによる文字認識の精度の比較
従来のOCRとAI insideマーケティングによる文字認識の精度の比較
[画像のクリックで拡大表示]

 通常の業務で使い勝手を高めるために、人が文字を認識するような仕組みを複数取り入れた。例えば、枠の中からはみ出した文字も認識したり、二重線で消した文字や訂正印などを読み飛ばしたりすることも可能だ。

 サービスでは、PDF形式やJPEG形式のデータを当日15時までにクラウドにアップロードすれば、夜間にデータをテキストデータ化して、翌日の11時に変換して返す。変換するデータ量によって料金が決まる従量課金制をとる。