• BPnet
  • ビジネス
  • IT
  • テクノロジー
  • 医療
  • 建設・不動産
  • TRENDY
  • WOMAN
  • ショッピング
  • 転職
  • ナショジオ
  • 日経電子版
  • PR

  • PR

  • PR

  • PR

  • PR

クジラ飛行机「仕事に役立つJavaScript入門」

JavaScriptで自動文字認識! Microsoftの無料OCRライブラリーを使おう(後編)(第118回)

クジラ飛行机=スーパークリエーター 2013/06/10 PC Online

 「JavaScriptで自動文字認識」プログラムについての解説の前編では、JavaScriptを使って、画像に書かれている文字をテキストで抽出するプログラムを作りました。

 前編で簡単なテストプログラムを作るところまで進めましたが、今回は、複数の画像から連続で文字認識をして、テキストファイルに保存するプログラムを作ってみましょう。Webサイトのスクリーンキャプチャーや、スキャンした画像などをテキストとして保存するのに便利なプログラムです。

MicrosoftのOCRライブラリー「MODI」について

 今回解説するプログラムは、Windows専用です。JavaScriptから手軽に画像文字認識を行うために、Microsoftが提供する「MODI」のOCR機能を利用します。このライブラリーのために、無料でダウンロード可能な「SharePoint Designer 2007」をインストールする必要があります。

 必要なライブラリーだけをインストールする方法については前編で詳しく説明していますので、そちらをご覧ください。

プログラムの使い方

 今回のプログラムは、こちらからダウンロード(118-program.zip)することができます。Windows上で動作するWSH/JScriptで作っています。ダウンロードしたアーカイブファイルを解凍すると「連続OCR.jse」というファイルがあり、これがメインプログラムです。

 文字の書かれた複数の画像ファイルを、この「連続OCR.jse」にドラッグ・アンド・ドロップすると、文字認識の処理が行われ、「(画像ファイル名).out.txt」の名前で認識したテキストを保存します。

ここから先はITpro会員(無料)の登録が必要です。

次ページ MODIライブラリーの認識精度を検証
  • 1
  • 2
  • 3
  • 4
  • 5

あなたにお薦め

連載新着

連載目次を見る

今のおすすめ記事

ITpro SPECIALPR

What’s New!

経営

アプリケーション/DB/ミドルウエア

クラウド

運用管理

設計/開発

サーバー/ストレージ

クライアント/OA機器

ネットワーク/通信サービス

セキュリティ

もっと見る