先日のxpdfでは、うまく日本語が抽出できなかったので今度は文字認識ソフト(OCR)に手を出してみる。vectorから読んdeココ ver1.0 DL体験版をダウンロードしてインストールする。まあ30日はOKってわけだ。最近のOCRソフトはとっても便利で、「画面をキャプチャして認識」というボタンがある。これはいい。PDFをAcrobatで開いて、200%位に拡大して画面の範囲指定をすると一発で文字認識可能。ただしPDFの拡大率を200%以下にすると認識率がガクっとおちるみたいなので、結構少い文字数ずつしか認識できない。1600×1200位の解像度があるとPDF1枚を200%の拡大率で表示できそうなので、デスクトップ機でやるとしあわせかも。つーかまじめに勉強しろYO>>俺。まぁツールはツールとして。。
Similar Posts:
- None Found