TesseractOCR individuelle Schulung

1535
Jim

Ich verstehe es nicht, wie soll ich Tesseract sagen, dass es sich tatsächlich um a b cBuchstaben handelt?

Anhängen von makebox in cli erzeugte diese Datei:

C 78 127 104 166 0 l 96 127 118 166 0 . 116 127 126 140 0 - 124 127 130 145 0 j 145 127 162 188 0 o 154 127 183 158 0 b 203 131 241 164 0 
1

1 Antwort auf die Frage

0
Pranaysharma

Sie können den folgenden Link verwenden, um mehr darüber zu erfahren, wie Sie Tesseract trainieren. Um die Box-Dateien zu korrigieren, können Sie jTessBoxEditor verwenden . Denken Sie daran, dass Sie die Bilder möglicherweise vorverarbeiten müssen.