Sie müssen die Seitennummer (6. Spalte) in jeder Box-Datei aktualisieren und dann die Dateien zu einer Verketten. Die Seitennummer ist nullbasiert und muss mit der Reihenfolge der einzelnen Seiten im mehrseitigen TIFF-Bild übereinstimmen. Wenn Sie fertig sind, können Sie dies durch Öffnen des Bildes in jTessBoxEditor überprüfen, um zu prüfen, ob die Kästchen mit dem Bild übereinstimmen.
In jTessBoxEditor for Tesseract wird das Kombinieren mehrerer TIFF / Box-Dateien in einer trainierten Datendatei beschrieben
1102
coldbreeze16
Ich denke, dass dies mit der Befehlszeile möglich wäre, aber wie es mit jTessBoxEditor zu tun ist, da dies einen großen Workflow automatisieren würde.
Da jTessBox mehrseitige TIFF-Dateien unterstützt, denke ich, dass dies der Fall sein könnte, aber wie organisiere ich in diesem Fall Boxdateien?
1 Antwort auf die Frage
1
nguyenq
Verwandte Probleme
-
3
Welche Software kann Handschrift in Text umwandeln?
-
3
Wie kann ich Schriftarten aus einem Bild erkennen?
-
3
Was ist eine gute Handschrifterkennungssoftware?
-
9
Wie extrahiere ich Text mit OCR aus einem PDF unter Linux?
-
8
Praktische OCR-Lösung zum Konvertieren eines großen Buches in ein digitales Format?
-
8
Wie kann ich gescannte Bilder als PDF in eine durchsuchbare PDF-Datei konvertieren?
-
1
Ist es möglich, Acrobat von der Befehlszeile aus aufzurufen, um OCR auszuführen
-
7
Extrahieren von Text aus einem .PDF-gescannten Buch
-
3
Wie starte ich einen OCR-Scan in Microsoft Office Word 2010?
-
2
Bild in Text konvertieren