カーネギーメロン大学は米国時間5月24日,CAPTCHAと呼ばれる画像認証技術を書籍のデジタル化に活用するオンライン・サービス「reCAPTCHA」を発表した。同サービスでは,CAPTCHAによるユーザー認証を行う際,通常の認証用画像と一緒に,書籍デジタル化で歪んだ文字スキャン画像も表示し,両画像に対応する文字を入力してもらうことで認証と書籍デジタル化を同時に処理する。

 CAPTCHAは,ユーザー認証などで必要なパスワード文字列を歪ませるなど,故意に読みにくくした画像として画面に表示し,入力された文字列と元の文字列を比較する。これにより,実際に人間が手作業で入力しているかどうかを判断でき,プログラムなどを使った不正アクセスやスパム・コメント投稿などを防ぐ。

 reCAPTCHAでは,通常のCAPTCHAによる認証時に,デジタル化できなかった不鮮明な文字画像を表示し,適切な文字を入力してもらう。認証用の文字画像と書籍デジタル化用の文字画像を並べて表示し,ユーザーに両方の文字列を入力してもらい,正しい認証用文字列が入力された場合には,書籍デジタル化用の入力文字列も正しい可能性が高いと判断する。この作業を繰り返すことで,書籍デジタル化における文字認識の精度を高めていく。

 カーネギーメロン大学は米Intelの協力を得て,reCAPTCHAサービスを開発した。書籍デジタル化に関するコンソーシアムOpen Content Alliance(OCA)の活動支援を目的としており,個人ユーザーは無償で利用できる。トラフィックの多い商用Webサイトは有償となる。

 米メディア(CNET News.com)によると,reCAPTCHAシステムは5月22日に運用を始める。これまでに150サイトが導入し,8000単語のデジタル化を行ったという。

[発表資料へ]