tesseract
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[DTP関連]]
tesseractは、スキャナなどで読んだ文字をOCRし、文字テキス...
文字埋め込みのPDFを作ります。
例えば、~/desktop/JA1-02.jpgを処理する場合
$ tesseract JA1-02.jpg JA1-02 -l jpn+eng pdf
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
Info in fopenReadFromMemory: work-around: writing to a t...
Detected 57 diacritics
デスクトップにJA1-02.pdfができあがる
$ PDFtoText -raw JA1-02.pdf
JA1-02.txtができあがる
古い和文局リストを読み込ませてOCR化してみましたが、認識度...
1600dpiのTIFより800dpiのjpgの方が認識率は上でした。私のTe...
終了行:
[[DTP関連]]
tesseractは、スキャナなどで読んだ文字をOCRし、文字テキス...
文字埋め込みのPDFを作ります。
例えば、~/desktop/JA1-02.jpgを処理する場合
$ tesseract JA1-02.jpg JA1-02 -l jpn+eng pdf
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
Info in fopenReadFromMemory: work-around: writing to a t...
Detected 57 diacritics
デスクトップにJA1-02.pdfができあがる
$ PDFtoText -raw JA1-02.pdf
JA1-02.txtができあがる
古い和文局リストを読み込ませてOCR化してみましたが、認識度...
1600dpiのTIFより800dpiのjpgの方が認識率は上でした。私のTe...
ページ名: