Ja, Sie können die Wörterbücher deaktivieren, indem Sie eine Konfigurationsdatei definieren, die Folgendes enthält:
load_system_dawg F load_freq_dawg F
und spezifizieren Sie es mit dem Befehl.
Ich bin daran interessiert, OCR zu verwenden, um Text aus einem Dokument zu erkennen, das keine Wörter enthält. Es handelt sich vielmehr um ein Dokument mit einer langen Folge von "zufälligen" gedruckten Zeichen. Ich habe versucht, Tesseract zum Scannen des Textes zu verwenden, aber es scheint nach Wörtern zu suchen. Gibt es eine Möglichkeit, tesseract mitzuteilen, nur die Zeichenerkennung durchzuführen?
Ja, Sie können die Wörterbücher deaktivieren, indem Sie eine Konfigurationsdatei definieren, die Folgendes enthält:
load_system_dawg F load_freq_dawg F
und spezifizieren Sie es mit dem Befehl.