カテゴリー
未分類

OCR

先日のxpdfでは、うまく日本語が抽出できなかったので今度は文字認識ソフト(OCR)に手を出してみる。vectorから読んdeココ ver1.0 DL体験版をダウンロードしてインストールする。まあ30日はOKってわけだ。最近のOCRソフトはとっても便利で、「画面をキャプチャして認識」というボタンがある。これはいい。PDFをAcrobatで開いて、200%位に拡大して画面の範囲指定をすると一発で文字認識可能。ただしPDFの拡大率を200%以下にすると認識率がガクっとおちるみたいなので、結構少い文字数ずつしか認識できない。1600×1200位の解像度があるとPDF1枚を200%の拡大率で表示できそうなので、デスクトップ機でやるとしあわせかも。つーかまじめに勉強しろYO>>俺。まぁツールはツールとして。。

About Keiichi Yasu

音声・音響・聴覚情報処理に興味がある研究者。現在は吃音についての研究を行っている。Linuxを1998年より嗜む。

カテゴリー
未分類

Excelのマクロ

実験のデータ整理のときにExcelのマクロ機能使ってるんですが、【実行】ボタンを押すときが一番シビレる。ごちゃごちゃのデータがすごい勢いでまとまっていくのを見るのがすげー楽しい。

About Keiichi Yasu

音声・音響・聴覚情報処理に興味がある研究者。現在は吃音についての研究を行っている。Linuxを1998年より嗜む。

カテゴリー
未分類

昼に

バイト先でとうもろこしと漬物をいただく。うめぇ

About Keiichi Yasu

音声・音響・聴覚情報処理に興味がある研究者。現在は吃音についての研究を行っている。Linuxを1998年より嗜む。