凸版印刷は2017年4月25日、江戸期以前に書かれた歴史的資料のくずし字を翻刻文(テキスト)や現代語翻訳文、多言語翻訳文に置き換えて表示できるWebビューアー「ふみのは」を開発したと発表した。5月から同ビューアーを用いた公開用データ制作サービスを提供開始する。

ふみのはの画面例
ふみのはの画面例
(出所:凸版印刷、以下同)
[画像のクリックで拡大表示]

 同社は、2015年にくずし字で記載される古典籍の文字を判別し、テキストデータに変換する光学文字認識(OCR)技術を確立し、大学や研究機関と共同で実証実験を行っている。今回開発したふみのはは、歴史的資料の原本画像の上に、翻刻文や翻訳文を重ねて表示できる。

 翻刻文はテキストとして扱えるため、全文検索やインターネット上の横断検索などで利用できる。表示データはHTMLやCSSなど標準的なWeb技術のみで構成されるため、配信のための維持管理コストが不要。ビューアー用データ製作後、迅速な公開が可能。

ふみのはのシステム構成
ふみのはのシステム構成
[画像のクリックで拡大表示]

 原本画像およびテキストからビューアー用データを生成するまでの価格は1ページ2000円から。原本のスキャニング、目視およびOCRによる翻刻、現代語訳、Webサーバー構築費用などは別途。同社では、全国各地に眠る歴史的資料の観光資源化や訪日外国人周遊促進など地方創生に向けた観光地域づくりとして同事業に取り組んでいく。

凸版印刷のWebサイト