AI開発を手がけるCogent Labsは2017年8月23日、画像から文字列を認識してテキストデータに変換するOCRサービス「Tegaki」の提供を始めた。深層学習を使った独自のOCRエンジンを利用。同社の検証で99.22%の精度が出ているという。

 サービスは手書き文字をテキストデータに変換するAPI(アプリケーション・プログラミング・インタフェース)として提供する。ユーザーはPNGやJPEGの画像データをTegakiのAPIで送信。認識の成功/失敗をAPIで確かめてからJSON形式で認識結果を受け取る。認識対象の領域と会社名や氏名などの属性は、開発者向けの管理画面「Tegaki EDITOR」を使ってGUIで設定できる。

画像からテキストを読み取る領域や属性を指定する「Tegaki EDITOR」
画像からテキストを読み取る領域や属性を指定する「Tegaki EDITOR」
[画像のクリックで拡大表示]

 OCRには漢字や記号を含む手書き文字列を深層学習(ディープラーニング)で学習させた推論モデルを利用。帳票印刷などを手がけるトッパン・フォームズなど十数社への試験提供で得られた学習データも認識率の向上に寄与しているという。正式サービス開始後にユーザーから得たデータを学習させ、認識率を継続的に向上させる予定だ。

 価格は認識対象の数字列や文字列といった領域単位で課金する従量制で、APIとTegaki EDITORを利用できる「スタンダードプラン」の最低利用料は月額20万円から。マス目のある領域はマス目ごとに0.2円、自由記入の領域は0.8円を課金する。

 例えば6ケタの数字がマス目で区切られている場合は0.2×6で1.2円、自由記入の数字はまとめて0.8円になる。

 セキュリティや個人情報保護などの導入支援を含む「エンタープライズプラン」も用意する。価格は個別見積もり。