Ich denke, Sie folgen dem Beitrag von Michael Lissner, um Tesseract eine eigene Schriftart hinzuzufügen.
Ich habe das Gleiche (den convert
Befehl) ausprobiert und mich mit einer kaputten TIFF beschafft, die mit keiner Anwendung geöffnet werden konnte.
Also habe ich die GUI-Alternative gewählt. Ich habe meinen Text in Scribus geschrieben (weil es mir möglich war, den Abstand zwischen den Zeichen zu vergrößern) und dann direkt als TIFF aus dem Menü Datei - Exportieren - Als Bild speichern exportiert . Ich habe eine Auflösung von 300 DPI gewählt.
Was können Sie noch probieren:
- GIMP öffnet PDF-Dateien, die als TIFF gespeichert werden können
- Ghostscript:
gs -sDEVICE=tiffgray -r300x300 -dNOPAUSE -dBATCH -sOutputFile=<image_file> <input_pdf>
(konvertiert in diesem Fall alle Seiten)
Welche anderen Probleme können Sie haben:
- Linux: Wenn Sie die Repo-Version von Tesseract installiert haben (zumindest in Ubuntu), verfügen Sie nicht über die erforderlichen ausführbaren Dateien:
unicharset_extractor
undmftraining
(oder sie befinden sich nicht im Pfad, da das Paket sie enthalten sollte ).