OCR[光学式文字読取装置】の活用

パソコン関連  2006/12/ 5

CRとは画像データの文字列を読み取り、テキストデータとして出力してくれるソフトです。
例えば雑誌や新聞などをスキャンして文字を抽出したり、アンケートなどの文字も簡単にデータ化できます。
数年前は読み取り精度に難がありましたが、最近のソフトは精度が上がり一発で読取ることもザラです。

今回試してみたソフトは14日間無料体験ができる「e.Typist v.11.0 体験版 for Windows」です。
ソフトを立ち上げ画像を読取り、レイアウトを設定後、認識させるとスラスラーっと読取ってくれます。
写真がボケてたり、暗かったりすると読み取り精度が落ちますが、大抵ストレスなく読取れます。

OCRを知ってる人ならば当然のことですね。

ただ、精度の高いOCRがあればたくさんの活用方法があります。
例えば、OCR=スキャナとイメージしがちですが画像データであれば何でもOKです。

・デジカメで雑誌や新聞を撮影した画像データ
・テキスト抽出できないPDFをプリントスクリーンで画像へ

平面ではないモノをスキャナで読取るのは不可能ですから、デジカメで撮影する方がベストです。
遠くにある看板・案内などもデジカメで撮影してOCRで読取ることが可能です。
もちろん、今見ている画面をプリントスクリーンで画像化することにより読み取りができます。

また、読み取りですが今回紹介したソフトは日本語だけではなく英語などの58カ国語に対応しています。
ということは活用方法としてこんなこともできます。

外国語の資料が届いたとき、その資料を見ながら辞書をひくのは大変な作業です。
しかも、翻訳作業はもっと大変。そんなときはOCRで読取らせてデータ化すれば、後は翻訳ソフトに流し込むだけでOKです。(外国語の資料が届くかは知りませんが・・・)

そして、全ての画像に共通して使えますが、読み取りたい画像をPhotoshopなどのソフトで見易く加工すると読み取り精度が格段にアップします。明るくしたり、文字を強くするだけです。
アイデアによってはOCRをもっと活用できそうです。

«BACK   NEXT »  

WEBコラムカテゴリー

最近のエントリー

月別アーカイブ