Ich habe eine interessante Idee gefunden, die es Google ermöglicht, die gesamte Arbeit der OCR-Erstellung der PDF-Dateien für Sie zu erledigen.
Wie macht man OCR in einem PDF-Dokument?
Mögliches Duplizieren:
Wie extrahiere ich Text mit OCR aus einem PDF unter Linux?
Ich habe einige Dokumente in Englisch und Hebräisch, die ich eingescannt und in das PDF-Format konvertiert habe.
Gibt es ein kostenloses oder billiges Dienstprogramm, das ein gescanntes PDF verarbeiten kann und OCR zumindest in Englisch, vorzugsweise auch in Hebräisch, ausführt?
Vielen Dank!
3 Antworten auf die Frage
Ich habe eine Liste der kostenlosen OCR-Software für Windows gefunden.
- FreeOCR
- Tesseract
- WeOcr Tesseract-Webschnittstelle
- GOCR
- Windows GUI für GOCR
- OCR-Desktop
- Einfache OCR
- TopOCR
Diese Programme benötigen jedoch eine Bildeingabe, keine PDF-Eingabe. Versuchen Sie dazu einen PDF-zu-JPG-Konverter .
Ich persönlich würde Ghostview verwenden, um sie in ein Bild zu konvertieren, und dann Tesseract, um sie in Text zu konvertieren. Dies ist eine völlig kostenlose, quellplattformübergreifende Open-Source-Lösung, mit der ich beim Konvertieren von Nur-Text sehr gute Ergebnisse erzielt habe. Ich verwende es nicht für komplexe Dokumente mit Tabellen und dergleichen, aber für einfachen Text kann man den Preis nicht schlagen.
Verwandte Probleme
-
14
PDF Viewer unter Windows
-
8
Firefox PDF-Plugin zum Anzeigen von PDF-Dateien im Browser unter Windows
-
17
So drucken Sie Dokumente als PDF
-
2
Firefox zum Drucken von PDF-Schriftarten
-
4
PDF Reader für iPhone
-
6
Adobe Reader: Kennwort für eine PDF-Datei merken
-
4
Kann ich einer PDF-Datei eigene Lesezeichen / Registerkarten hinzufügen?
-
5
Welche Adobe Acrobat-Alternativen verfügen über PDF-Signaturfunktionen
-
3
Welche Software kann Handschrift in Text umwandeln?
-
1
Ein Inhaltsverzeichnis für viele .odt-Dateien erstellen