富士通と富士通フロンテックは、カラー帳票の手書き文字の認識精度を向上する「リアルカラー認識技術」を開発した。カラー帳票で手書き文字が枠線にかかった場合でも正確に文字を認識できるようになるという。従来方式で文字認識率が60~95%程度だったものが98%に、帳票の種類の判別率が90%から99%に、それぞれ向上した。2月末から順次OCR製品などに搭載する。

 同技術では、帳票の判別や文字認識をする際に、色をRGB(赤、緑、青)から、HSV(色相、彩度、明度)の色空間に変換する。HSVは人間の感覚に近い色空間で、人の目で区別できる色の違いを、そのまま文字や枠線の判別に利用できるのが特徴だ。

 例えば、手書き文字と重なっている緑の枠線を消して、文字だけを認識させる場合、緑の印刷は通常青と黄のインクの混合であるため、緑を指定して枠線を消そうとしても想定通りに消せなかった。HSV空間に一度変換すると、青と黄色の混合は人間の見た目と同じ緑に変換されるので、枠線を高い精度で分離できる。文字と枠線が重なるところで文字色が微妙に変わるケースも、「一度文字のエッジを抽出する作業を経た後、文字を判別することにより高精度で判別できる」という。

 今回の技術により、読み取り項目ごとに異なる枠線で印刷された帳票や、文字枠内が色で塗りつぶされているような帳票といった、これまで対応が難しかった帳票の読み取り精度が向上する。

 富士通は、リアルカラー認識技術を、e文書法対応の業務パッケージ「セキュアファイリングAE」、銀行業務向け入力ソフト「ITF」、汎用OCR製品「AutoENTRY」に導入していく。セキュアファイリングAEには3月末のバージョンアップ時に組み込む予定だ。富士通によると、手書き入力した帳票の文字認識精度が低く、文書を電子化した後の検索性が悪かったことが、e文書法対応ソフトの導入のネックの一つになっていたという。同社は、リアルカラー認識技術を武器に同機能に対するニーズが高い金融機関に3製品を売り込み、2008年度末までに3万本、金額で50億円の販売を目指す。