OCRの活用方法

パソコン関連  2007/8/22

OCRといえば光学文字認識と言われ、文書の文字画像データをデジタルテキストに変換する装置です。
例えば雑誌や新聞などの紙データをテキスト化したい場合は、まずスキャナでデータ化した後、OCRソフトで読み込む作業となります。但し、一般的に文章認識が主と思われがちですが違う用途もたくさんあります。

例えば、記号や数字の読み取りの場合、正しく認識できる確率は99%を超えるレベルです。
漢字やひらがなの場合、認識率はよくても95%程度ですから99%は十分実用的なレベルとなります。
記号や数字を読み取るケースといえば、試験やアンケート、マークシートなどです。

これらは専用の読み取り機を買わなくても、高速スキャナ+OCRソフトで処理することが可能です。
学校では答案用紙の添削をスキャナ+OCRで高速採点するソフトが既に実用化されています。

採点革命
http://www.nurs.or.jp/~lionfan/freesoft_45.html

答案用紙の採点や伝票の読み込み、アンケートの集計、登録用紙のデータ化などOCRの用途は多方面に渡ります。
しかも、高速スキャナ又は普通のスキャナ+OCRソフトを使うことにより思ったよりお手軽に実現できるのです。

単純な数字等の読み取りを実用化している身近な例が、郵便局の区分機です。
ハガキには郵便番号を記述する枠がありますが、郵便局のOCRではその番号や住所を認識して自動的に仕分けを行っているのです。もちろん認識できない場合は人が作業することになります。

OCRソフトはたくさんの種類が発売され、無料体験できる製品も多々あります。
手作業でやっていることを効率化できないか一度考えてみてはどうでしょうか?
学生であれば宿題やレポートなどにも応用できるかもしれませんね。

«BACK   NEXT »  

WEBコラムカテゴリー

最近のエントリー

月別アーカイブ