Tesseract 3.03 englischsprachige Daten

Question

tesseract-ocr

Tesseract 3.03 englischsprachige Daten

5883

MarAja 2014-05-26 в 11:44

Tesseract 3.03 wurde kürzlich veröffentlicht und ich habe es gerade installiert. Englischsprachige Daten werden jedoch nicht mit dem Download bereitgestellt (von https://launchpad.net/ubuntu/+source/tesseract/3.03.03-1 ). Auf der Tesseract-Website gibt es einen "Download" -Link, aber Sie können nur "englischsprachige Daten für Tesseract 3.02" finden. Wo finde ich die für 3.03?

4

2 Antworten auf die Frage

4

1

Alasdair 2014-07-16 в 11:06

Sie können die Sprachdaten aus 3.02 auf 3.03 RC verwenden.

Bitte beachten Sie auch, dass 3.03 noch nicht offiziell freigegeben wurde. Das ist ein RC-Build.

Accepted Answer · 2014-10-01 15:06:59

Wie bereits von anderen erwähnt, können Sie die englischen Sprachpakete von 3.02 für 3.03 verwenden. Nachfolgend die Anweisungen:

Laden Sie das Programm hier herunter und entpacken Sie es: 1

Voraussetzungen installieren und entpacken

`sudo apt-fast install -y libicu-dev libpango1.0-dev libcairo2-dev` `tar xfv tesseract-ocr-3.02.eng.tar.gz`

Extrahieren Sie das englische Datenpaket von Tesseract in das Verzeichnis tessdata im Verzeichnis tesseract-3.03. Angenommen, beide (englischsprachige Daten und Tesseract-Quelldateien .tar.gz) befinden sich im selben Ordner

tar zxvf tesseract-ocr-3.02.eng.tar.gz

mv tesseract-ocr / tessdata / . tesseract-3.03 / tessdata /

4. Gehen Sie zurück zum Verzeichnis von tesseract und schließen Sie die Installation ab

cd tesseract-3.03  ./autogen.sh  ./configure  make -j  sudo make install LANGS="eng"  sudo ldconfig

Testen Sie nun Ihre Installation mit dem Test-Image im Verzeichnis

tesseract phototest.tif ans -l eng cat ans.txt

Ausgabe:

Dies ist eine Menge von 12-Punkt-Text, um den OCR-Code zu testen und festzustellen, ob er für alle Arten von Dateiformaten geeignet ist.

Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs.

HINWEIS: Einige Zeilen haben eine falsche Formatierung. Irgendwelche Ratschläge, um diese zu korrigieren, wären großartig

Tesseract 3.03 englischsprachige Daten

2 Antworten auf die Frage

Verwandte Probleme