Wie bereits von anderen erwähnt, können Sie die englischen Sprachpakete von 3.02 für 3.03 verwenden. Nachfolgend die Anweisungen:
- Laden Sie das Programm hier herunter und entpacken Sie es: 1
Voraussetzungen installieren und entpacken
`sudo apt-fast install -y libicu-dev libpango1.0-dev libcairo2-dev` `tar xfv tesseract-ocr-3.02.eng.tar.gz`
Extrahieren Sie das englische Datenpaket von Tesseract in das Verzeichnis tessdata im Verzeichnis tesseract-3.03. Angenommen, beide (englischsprachige Daten und Tesseract-Quelldateien .tar.gz) befinden sich im selben Ordner
tar zxvf tesseract-ocr-3.02.eng.tar.gz
mv tesseract-ocr / tessdata / . tesseract-3.03 / tessdata /
4. Gehen Sie zurück zum Verzeichnis von tesseract und schließen Sie die Installation ab
cd tesseract-3.03 ./autogen.sh ./configure make -j sudo make install LANGS="eng" sudo ldconfig
Testen Sie nun Ihre Installation mit dem Test-Image im Verzeichnis
tesseract phototest.tif ans -l eng cat ans.txt
Ausgabe:
Dies ist eine Menge von 12-Punkt-Text, um den OCR-Code zu testen und festzustellen, ob er für alle Arten von Dateiformaten geeignet ist.
Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs. Der schnelle braune Hund sprang über den faulen Fuchs.
HINWEIS: Einige Zeilen haben eine falsche Formatierung. Irgendwelche Ratschläge, um diese zu korrigieren, wären großartig