カテゴリー
未分類

OCR

先日のxpdfでは、うまく日本語が抽出できなかったので今度は文字認識ソフト(OCR)に手を出してみる。vectorから読んdeココ ver1.0 DL体験版をダウンロードしてインストールする。まあ30日はOKってわけだ。最近のOCRソフトはとっても便利で、「画面をキャプチャして認識」というボタンがある。これはいい。PDFをAcrobatで開いて、200%位に拡大して画面の範囲指定をすると一発で文字認識可能。ただしPDFの拡大率を200%以下にすると認識率がガクっとおちるみたいなので、結構少い文字数ずつしか認識できない。1600×1200位の解像度があるとPDF1枚を200%の拡大率で表示できそうなので、デスクトップ機でやるとしあわせかも。つーかまじめに勉強しろYO>>俺。まぁツールはツールとして。。

Similar Posts:

    None Found

作成者: YasuKeiichi

音声・音響・聴覚情報処理に興味がある研究者。現在は吃音についての研究を行っている。Linuxを1998年より嗜む。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください