Von Wikipedia :
Es wurde ursprünglich von 1985 bis 1995 als proprietäre Software bei Hewlett-Packard entwickelt. Nachdem Hewlett Packard und UNLV zehn Jahre lang keine Entwicklung stattfanden, wurde es 2005 als Open Source veröffentlicht. Tesseract wird derzeit von Google entwickelt und unter der Apache License veröffentlicht. Version 2.0.
Tesseract gilt als eine der genauesten derzeit verfügbaren freien Software-OCR-Engines
Der Nachteil ist, dass nur TIFF-Dateien verarbeitet werden. Möglicherweise können Sie einen anderen Konverter verwenden, um PDF in TIFF zu konvertieren und Tesseract die Arbeit erledigen zu lassen.