Zuerst müssen Sie diese Bilder anpassen. Ich empfehle ein Batch-Tool wie XnViewMP, das kostenlos und multiplattformfähig ist.
Es hat einen Datei-Explorer. Wählen Sie alle Ihre Bilder aus und gehen Sie zu " Extras - Stapelverarbeitung" . Aktionen hinzufügen wie ich:
Hier sind meine Handlungen:
- HLS - machen Sie Graustufen:
- Farbton: 0
- Helligkeit: 0
- Sättigung: -127
- Levels - Senken Sie den Schwarzpegel ein wenig, damit das Graurauschen verschwindet
- Schwarzpunkt: 0
- Weißpunkt: 212 - kann je nach Bild variieren
- Lärmminderung Filter
- Stellen Sie den Kontrast ein, um ihn zu erhöhen
- Helligkeit: 0
- Kontrast: 127 - das zählt
- Gamma: 1,06
- Minimum, um das Schwarz dicker zu machen
- Filtergröße: 5x5 - kann je nach Bild variieren
Vergessen Sie nicht zu speichern als tiff
(Siehe Registerkarte " Ausgabe" ). Danach laufe ich tesseract
:
tesseract test.tif text -psm 7
Hinweis Ich habe den PSM-Modus 7 ausgewählt: Das Bild wird als einzelne Textzeile behandelt. Wenn Sie mehrere Zeilen haben, müssen Sie wahrscheinlich Modus 6 oder 3 verwenden.
Und hier sind die Inhalte der text.txt
Ausgabedatei:
570 394 666 638 043