So entfernen Sie OCR aus einem PDF-Dokument

12853
Sanoo

Ich habe Google schon einige Zeit gesucht, aber ich habe keine Antwort auf meine Frage gefunden.

Ich habe unerwünschte OCR-Ebenen in einem Dokument, das ich kürzlich mit Adobe Acrobat gescannt habe. Es wurde nicht richtig OCR gemacht, und ich möchte einige Informationen korrigieren, aber der OCR macht die gewünschten Informationen, um gelöscht zu werden. Ich habe die Dateien in TIFs konvertiert, bemerkte aber einen (sehr) erheblichen Qualitätsverlust. Ich habe gehört, dass beim Drucken in ein anderes PDF entweder der Text erhalten bleibt oder die Bildqualität verringert wird.

Ich freue mich über jede Hilfe bei der Lösung dieses Problems so schnell wie möglich.

Danke dir.

11

5 Antworten auf die Frage

3
user1125483

In Acrobat Pro DC lautet der entsprechende Befehl "Ausgeblendete Informationen entfernen", der sowohl über die Werkzeuge "Schützen" als auch über "Entfernen" verfügbar ist.

Beim Ausführen des Befehls werden lediglich die ausgeblendeten Informationen durchsucht, das Dokument jedoch nicht geändert. Sie müssen Acrobat dann mitteilen, welche Informationen entfernt werden sollen. Wählen Sie in diesem Fall im Ergebnisbereich "Ausgeblendeten Text" aus, klicken Sie auf die Schaltfläche "Entfernen" und speichern Sie das geänderte Dokument.

Ich habe "ausgeblendete Informationen entfernen" verwendet, aber für mich aus irgendeinem Grund, der nur Teile des Bildes auf bestimmten Seiten entfernt. Vielen Dank für deine Antwort. Sanoo vor 7 Jahren 0
Dies ist nicht allgemein richtig. Irgendwie (wahrscheinlich MacOS PDFKit-Fehler) wurde mein ABBYY FineReader-OCR-Text beschädigt und das Kontrollkästchen "Verborgener Text" unter "Entfernen" → "Entfernen" wurde entfernt, sodass der Text ohne Probleme entfernt wurde. Anschließend konnte ich die Funktion zum Verbessern von Scans → Text erkennen erfolgreich verwenden, um die OCR-Funktion in Acrobat selbst auszuführen. Nicholas Riley vor 6 Jahren 0
Das Problem für mich ist, dass ich nach dem Entfernen des verborgenen Textes immer noch keine OCR mit "ClearScan" ausführen kann (z. B. "Bearbeitbarer Text und Bilder"). Es ist seltsam, weil die Textebene scheinbar verschwunden ist. Beim Ausführen von OCR wird jedoch der Fehler "Acrobat konnte keine Erkennung durchführen, da: Seite rendernden Text enthält". user1125483 vor 6 Jahren 0
1
Sanoo

Nach langem Experimentieren habe ich festgestellt, dass das Drucken mit Adobe Acrobat aus Adobe Acrobat das Dokument ohne OCR und ohne Qualitätsverlust druckt (eine auf den ersten Blick nicht wahrnehmbare Auflösung geht verloren).

Viele Websites behaupten jedoch, dass dies nicht funktioniert. Ich habe auch andere Drucker wie Foxit Reader und OneNote ausprobiert, aber die Qualität wurde reduziert. JPEG war auch das gleiche.

Bitte beachten Sie, dass Ihre Laufleistung variieren kann.

Hinweis: Ich lasse diesen Thread als unbeantwortet markiert, in der Hoffnung, eine bessere Antwort als meine zu finden.

1
jazzzz

In Acrobat Pro: Verwenden Sie "ausgeblendete Informationen entfernen" (unter "Schutz"). Alles auswählen, ausführen, OCR ist weg

1
Dave

In Acrobat X gibt es unter Schutz eine Schaltfläche zum Sanieren von Dokumenten, durch die ALLES entfernt wird, was jedoch sichtbar ist (einschließlich OCR-Textebene), wodurch das Dokument in eine abgeflachte Bitmap konvertiert wird.

0
Fran

(vor einem Jahr...)

Wenn, wie Sie sagen, die Dokumente gescannt und beispielsweise nicht aus Word als PDF-Dokument gedruckt werden, können Sie sie mit Adobe problemlos entfernen:

Wählen Sie Dokument, Dokument prüfen aus und jetzt können Sie den verborgenen Text (OCR) entfernen.

Danke für deine Antwort. Ich werde es so bald wie möglich testen und Sie wissen lassen. Danke für die Antwort! Sanoo vor 8 Jahren 0
Ich dachte, ich hätte das bereits kommentiert, aber das Problem ist, dass ich Acrobat DC Pro habe und diese Menüs entfernt wurden. Danke trotzdem für deine Antwort. Sanoo vor 8 Jahren 0