Kann ich ohne OCR auf das PDF "rollen"?

615
Knob1

Ich verwende Automator in Kombination mit Abbys Finereader, um einen Ordner nach neuen gescannten PDF-Dokumenten zu suchen. Der Finereader gibt das Dokument als OCR aus und exportiert es in eine neue PDF-Datei im selben Ordner. Ich habe nun seit einem Monat die Export-Einstellung "Text über Seitenbild" verwendet. Die Erklärung der Benutzerhandbücher für diese Einstellung lautet:

Diese Option speichert den Hintergrund und die Bilder des Originaldokuments und platziert den erkannten Text darüber. Normalerweise erfordert eine mit dieser Option gespeicherte PDF-Datei mehr Speicherplatz als eine Datei, die mit aktivierter Option Nur Text und Bilder gespeichert wurde. Das resultierende PDF-Dokument ist vollständig durchsuchbar. In einigen Fällen kann das Erscheinungsbild des resultierenden Dokuments geringfügig vom Original abweichen.

Das Problem ist, dass einige der gescannten PDFs und "OCRed" viele falsche Zeichen enthalten, aber ich habe gerade diesen Fehler entdeckt.

Ist es in irgendeiner Weise möglich, ohne OCR auf die Version zurückzurollen? Ich habe versucht, die PDF-Datei als TIFF-Datei zu exportieren, aber da sind auch die falschen Zeichen ...

Irgendwelche Ideen?

0
Die einzige Möglichkeit, die ich kenne, ist die Wiederherstellung des Originaldokuments. es klingt, als hätten Sie das Originaldokument nicht. Ramhound vor 7 Jahren 0
Ja, ich habe nicht das Originaldokument .. Knob1 vor 7 Jahren 0

1 Antwort auf die Frage

0
user291737

Da Sie geschrieben haben, dass Sie "Text über Seitenbild" gewählt haben, sollten die gescannten Originalbilder immer noch in Ihren PDF-Dateien enthalten sein. So erhalten Sie es zurück: Wenn Sie über Adobe Acrobat verfügen, haben Sie die Möglichkeit, Speichern unter> Bild> JPG, TIFF usw. zu verwenden. Andernfalls verwenden Sie einen kostenlosen PDF-Editor, z. B. PDF-XChange Viewer, und wählen Sie im Menü Datei den Befehl Exportieren> In Bild exportieren .. und wählen Sie Ihr Bildformat, z. B. TIFF. Auf diese Weise kann ich meine OCR-PDF-Dokumente (Text + Bild) auf die ursprünglich gescannten Bilder zurücksetzen.

Sie haben geschrieben, dass Sie versucht haben, sie wieder in Bilder (in Finereader?) Zu exportieren, und die resultierenden Bilder enthielten noch "falsche Zeichen". Anscheinend haben Sie nicht "Text über Seitenbild" gewählt, sondern eine Option, bei der das gescannte Bild nicht beibehalten wird, sondern das Layout mit dem OCR-Text neu erstellt wird (Adobe Acrobat nennt dies ClearScan). Diese Funktion erstellt das Layout des Scans so nahe wie möglich, wobei der OCR-Text in der am besten geeigneten Vorlage liegt und das gescannte Bild nicht in der PDF-Datei bleibt.