解説
OCR(Optical Character ReaderまたはOptical Character Recognition )とは、紙面の活字、手書きテキストを写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、書かれている内容を文字データとして取り出す装置やソフトウェアのこと。また、そのような方式による自動文字認識。
書籍のように印刷された紙面の文字は字形が美しく規則正しく並んでいるため認識しやすいが、かすれや汚れで不鮮明な箇所や、人間が手書きした文字などでは認識精度が下がる。また、漢字文化圏では文字の種類の多さや互いにそっくりな形の異なる文字の識別という独特の困難さがあり、アルファベット文化圏では筆記体の読み取りという困難さがある。
これに対し、択一式試験の答案用紙の読み取りなどに用いられる、紙面の所定の位置を黒くマークしたものを光学的に読み取る装置やシステムのことを「OMR」(Optical Mark Reader:光学式マーク読取装置)という。
使用例
OCRでデータ化をしてから、人間がチェックするので、データエントリーがすごく早くなったよ。