Wie entferne ich ein Wasserzeichen aus einer PDF-Datei?

119871
Shiki

Ich dachte, das wäre eine einfache Aufgabe, aber es stellte sich in die andere Richtung heraus.

Das Wasserzeichen ist auf jeder einzelnen Seite dasselbe (überlappende, aber transparente) Bild. Ich habe die PDF-Datei selbst mit PDFCreator 0.9.8 erstellt (daher gibt es hier keine Urheberrechtsprobleme).

Ich habe bereits Adobe Acrobat Pro meines Freundes ausprobiert, aber es hat nicht funktioniert. Es versucht es zu entfernen, aber es kann nicht. Ich habe versucht, Kopf- / Fußzeile usw. zu entfernen, aber das Wasserzeichen verschwindet einfach nicht.

Wie kann ich das Wasserzeichen entfernen?

41
PDF ist ein Ausgabeformat, wie eine elektronische Druckseite. Es ist nicht dafür gedacht, bearbeitet zu werden, und in den meisten Fällen können Sie nicht das tun, was Sie möchten, wenn Sie die Seiten nicht in Bilder exportieren und die Wasserzeichen mit Photoshopping versehen. mk12 vor 12 Jahren 2
Einkaufsempfehlungen sind für alle Stack-Exchange-Websites nicht relevant. Um zu verhindern, dass diese Frage geschlossen wird, würde ich empfehlen, sie in eine Wie-Frage zu ändern, anstatt auf welche Canadian Luke vor 12 Jahren 0
Anscheinend würden Sie einfach PDFCreator 0.9.8 verwenden und die Option so einstellen, dass KEIN Wasserzeichen zu jeder Seite hinzugefügt wird. Ich gehe davon aus, dass diese Frage ist, weil Sie nicht über die Originalquelle verfügen. Ramhound vor 12 Jahren 3

8 Antworten auf die Frage

73
Dennis

Für bildbasierte Wasserzeichen gibt es mehrere Tools, die deren automatische Entfernung versprechen. Zum Beispiel:

Alle können kostenlos getestet werden, erfordern jedoch eine Lizenz, um die gewünschte Ausgabe tatsächlich zu erzeugen.

Das Wasserzeichen dieser spezifischen PDF-Datei (die mir das OP per E-Mail gesendet hat) ist jedoch kein einzelnes Bild, das auf allen Seiten wiederholt wird. Es stellt sich heraus, dass PDFCreator es (fast Pixel für Pixel) in jeden einzelnen von ihnen hartcodiert hat. Dadurch wird das Entfernen des Wasserzeichens wesentlich schwieriger (und es entsteht eine aufgeblähte PDF-Datei).

Da das Wasserzeichen eigentlich aus vielen kleinen Bildern besteht, können Sie diese mit einem PDF-Editor (z. B. Foxit Advanced PDF Editor ) entfernen, indem Sie sie einfach auswählen und drücken Delete. Leider müssen Sie dies für jede Seite wiederholen.

Eine weniger zeitaufwendige Lösung wäre das programmgesteuerte Entfernen des Wasserzeichens. Wir brauchen:

Schritte

  1. Laden Sie Pdftk herunter und entpacken Sie pdftk.exe und libiconv2.dll nach % windir% \ System32, einem Verzeichnis im Pfad oder an einem anderen Ort Ihrer Wahl.

  2. Laden Sie Notepad ++ herunter und installieren Sie es.

  3. PDF-Streams werden normalerweise mit dem DEFLATE- Algorithmus komprimiert . Das spart Platz, macht die Quelle der PDF-Datei jedoch unleserlich.

    Der Befehl

    pdftk original.pdf output uncompressed.pdf uncompress 

    dekomprimiert alle Streams, sodass sie mit einem Texteditor geändert werden können.

  4. Öffnen Sie uncompressed.pdf mit Notepad ++, um die Struktur des Wasserzeichens anzuzeigen.

    In diesem speziellen Fall beginnt jede Seite mit dem Block

    q 9 0 0 9 2997 4118.67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q 

    und fast 4000 Blöcke genau wie dieser. Dieser bestimmte Block legt nur eines ( /W 1 /H 1) der Pixel des Wasserzeichens fest.

    Wenn Sie nach unten scrollen, bis sich das Muster ändert, wird angezeigt, dass der Stream des Wasserzeichens 95.906 Byte lang ist (Zeilenumbrüche zählen). Der gleiche Stream wird auf jeder Seite der PDF-Datei wiederholt.

  5. Drücken Sie Ctrl+ Hund stellen Sie Folgendes ein:

    Find: q 9 0 0 9 2997 4118\.67 cm. Replace: (blank) Match case: checked Wrap around: checked Regular expression: selected . matches newline: checked 

    Der reguläre Ausdruck q 9 0 0 9 2997 4118\.67 cm.stimmt mit der ersten Zeile des obigen Blocks ( q 9 0 0 9 2997 4118.67 cm) und allen folgenden 95.881 Zeichen überein, dh dem Stream des Wasserzeichens.

    Wenn Sie auf Alle ersetzen klicken, wird es von allen Seiten der PDF-Datei entfernt.

  6. Das Wasserzeichen wurde jetzt entfernt, aber die PDF-Datei enthält Fehler (die Längen der Streams sind falsch) und ist nicht komprimiert.

    Der Befehl

    pdftk uncompressed.pdf output nowatermark.pdf compress 

    kümmert sich um beides.

  7. uncompressed.pdf wird nicht mehr benötigt. Sie können es löschen.

Das Ergebnis ist das gleiche PDF ohne Wasserzeichen (und etwa die Hälfte der Größe).

Ein weiterer Trick, den ich nützlich fand: Es war schwierig für mich, den Block zu ermitteln, der dem Wasserzeichen in meinem PDF entspricht. Ich habe also nur eine einzelne Seite aus dem PDF-Dokument extrahiert, im Idealfall eine Seite, auf der nur das Wasserzeichen und nicht viel anderes vorhanden ist. Allein von dieser einen Seite sollte es einfacher sein, den Block zu ermitteln, der dem Wasserzeichen entspricht. Gehen Sie dann zurück und machen Sie es für das Original-PDF. Kenny LJ vor 9 Jahren 4
Wow, das ist der erste Ort im Internet, den ich gefunden habe. Gibt es Orte, an denen Sie sich über das Containerformat informieren sollten? ConstantineK vor 9 Jahren 1
@Hobs IIRC, ich habe Teile der offiziellen [PDF-Referenz] (http://www.adobe.com/devnet/pdf/pdf_reference_archive.html) gelesen, um diese Antwort zu schreiben. Dennis vor 9 Jahren 2
Vielen Dank @Dennis, ich habe dir bereits eine positive Bewertung gegeben, aber dies scheint die beste kanonische Quelle zu sein. Ich konnte das, was ich brauchte, durch einfaches Suchen / Ersetzen und ein paar zusätzliche Komprimierungsversuche und -fehler ausführen. RIESIGE HILFE! ConstantineK vor 9 Jahren 1
Anstelle von "pdftk" können Sie auch "qpdf" verwenden, um die PDF-Dateien zu dekomprimieren und zu komprimieren. Befehle: `qpdf - stream-data = unkomprimiert original.pdf uncompressed.pdf` und` qpdf --stream-data = Komprimieren uncompressed.pdf nowatermark.pdf` David Schuler vor 8 Jahren 6
Hervorragende Beschreibung von _how_, um dieses Problem zu lösen. Ich hatte ein ähnliches Wasserzeichen, das anders gemacht wurde, aber dieses Verfassen ermöglichte es, es weiterzuverfolgen. Für mich war ich in der Lage, ähnliche Blöcke zu finden, um einen anständigen Regex zu erhalten, der die meisten von ihnen erwischen konnte, da sie eine variable Länge haben. Byron Wall vor 8 Jahren 0
Viele Produkte sind sehr bemüht, die Wasserzeichendaten in die eigentliche Nutzlast einzubetten, wodurch alle beschriebenen Softwareprodukte und -techniken kraftlos werden. Irgendwelche Ideen, um diese zu besiegen? Jari Turkia vor 6 Jahren 0
@JariTurkia Angenommen, es ist in einem einzigen Block codiert, sollte die Technik in meiner Antwort funktionieren. Andernfalls können Sie kein Glück haben. Dennis vor 6 Jahren 0
@Dennis Das Produkt, mit dem ich versagt habe, ist XMind: Zen. Fühlen Sie sich frei, es selbst auszuprobieren. Jari Turkia vor 6 Jahren 0
Für Menschen, die in der Zukunft auf diese Frage kommen (einschließlich mir): "pdftk" schien bei mindestens einer PDF-Datei einzufrieren; `qpdf` hat ohne Probleme funktioniert. `qpdf` hat einige Vorraussetzungen, die auf einem Mac erfüllt sein müssen, aber mit Homebrew installiert werden können. Dan Hicks vor 6 Jahren 0
6
LawrenceC

Es scheint, als sei das Wasserzeichen Teil der Bilder in der .PDF-Datei und kein separates Bild, das von dem, was Sie zur Anzeige der .PDF-Datei verwenden, darüber gerendert wird. Sie können das Wasserzeichen möglicherweise nicht entfernen, ohne die Bilder aus der PDF-Datei zu extrahieren, sie mit einem Bild-Editor auszuführen und die PDF-Datei anschließend manuell zu rekonstruieren.

4
heiner

Für Textwasserzeichen kann die Bearbeitung einer PostScript-Version wesentlich einfacher sein: Nachher

$ pdftops document.pdf

editieren Sie document.ps und konvertieren Sie es anschließend wieder in PDF

$ ps2pdf document.ps

Beachten Sie unter Linux, dass "pdftops" und "pdf2ps" unterschiedlich sind. Verwenden Sie den ersten Befehl, nicht den zweiten. Camille Goudeseune vor 6 Jahren 0
Wenn Sie wissen, was der Wasserzeichentext ist, ist hier ein Einzeiler. `pdftops in.pdf - | sed 's / WATERMARK //' | ps2pdf - out.pdf` Camille Goudeseune vor 6 Jahren 1
1
Alan Hord

Die Artefakte des Stempels bestehen darin, dass Sie ihn in Adobe Acrobat Pro löschen können. Er wird jedoch bei einer Mausbewegung neu generiert, da das Stream-Objekt es dauerhaft beibehält.

Wenn Sie versuchen, die PDF-Quelle zu bearbeiten - was schwierig ist, besteht die Möglichkeit, dass die Datei beschädigt wird.

Wenn es sich bei dem Stempel um einen Stream handelt, können Sie ihn unterbrechen, indem Sie den Computer vom Netz trennen, was ich getan habe.

Dann habe ich mit Adobe Acrobat Pro eine meiner Anmerkungen ausgewählt, mit der rechten Maustaste darauf geklickt, um das Popup-Fenster zu öffnen, und "Kommentarliste anzeigen" ausgewählt.

Wählen Sie das schädliche Wasserzeichen / Stempel aus der Liste aus, klicken Sie mit der rechten Maustaste, um das Popup zu öffnen, und wählen Sie "Löschen". Tun Sie dies auf jeder Seite, auf der die Fixierung erfolgt.

Speichern Sie die Datei unter einem anderen Namen. Meine Anwendung ist abgestürzt, aber nicht vor dem Speichern der Datei!

Öffnen Sie die neue und wesentlich kleinere Datei. Beachten Sie, dass alle Wasserzeichen / Stempel Gonzo sind.

In meinem Fall ist die Dateigröße meines 3-seitigen Dokuments von 300 KB auf beeindruckende 60 KB gesunken. Alle Originaldaten und Anmerkungen sind erhalten geblieben - ohne die Wasserzeichen.

~ Gute Jagd: o)

1
Shifa

konvertieren Sie das Dokument mit zamzar in eine .rtf-Datei. Das Wasserzeichen verschwindet nach der Konvertierung automatisch. Bitte beachten Sie: - Es funktioniert einwandfrei, wenn das Dokument Textmaterial enthält. Es war schon immer eine große Hilfe .. (Mac-Benutzer)

Dies funktioniert nicht für das PDF, das ich ausprobiert habe. Kenny LJ vor 9 Jahren 0
1
Dominik Antal

Einen anderen Weg gefunden, um es zu tun:

  1. Verwenden Sie das pdf2htmlEX- Tool (oder einen anderen PDF-in-HTML-Konverter), um die PDF-Datei in eine HTML-Datei zu konvertieren.
  2. Bearbeiten Sie HTML mit einem Texteditor und entfernen Sie das Wasserzeichen. Speichern Sie es.
  3. Drucken Sie im HTML-Format ein neues PDF-Dokument
  4. Profitieren
Vielen Dank. Sind Sie sicher, dass Sie das Wasserzeichen mit Adobe Acrobat auf diese Weise nicht entfernen können? (Dies könnte in der Tat eine billigere Lösung sein.) Shiki vor 7 Jahren 0
Ich glaube, Sie benötigen ein Kennwort, um das Wasserzeichen in Adobe Reader zu entfernen. Daher habe ich diese Methode verwendet. Dominik Antal vor 7 Jahren 0
0
Der Schley

Dies ist eine Ergänzung zur Antwort von @Dennis vom 18. Juli 2012, 30. Juli 2012. Er spricht sicherlich den schwierigeren Fall an.

Im einfachsten Fall, wenn das Wasserzeichen zum Beispiel einfacher Text ist

Smedley für den Kommissar

Die unkomprimierten PDF-Wasserzeichen können folgendermaßen definiert werden:

 BT 75.96 625 Td (Smedley For Commissioner)Tj ET 

wo 75.96ist der horizontale Versatz und 625der vertikale Versatz für diese bestimmte Wasserzeicheninstanz. (Ja, es können sowohl reelle Zahlen als auch ganze Zahlen angezeigt werden.)

Ein Regex wie der folgende funktioniert für alle derartigen Wasserzeichen und ignoriert jegliche Variationen in ihrer Platzierung:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n 

Beachten Sie, dass verschiedene modifizierende PDF-Operatoren mit Wasserzeichen mit komplizierteren Formatierungen ins Spiel kommen können. Diese Phantasie kann das, was der Leser erwartet (hofft?), Als zusammenhängende, leicht zu suchende Zeichenfolge in ein Durcheinander von Buchstabensuppe verwandeln. Zum Beispiel,

E 1 = mc² von Smedley ™

Könnte das Produkt davon sein:

 BT 75.96 625 Td (E)Tj -5 Ts (1)Tj 0 Ts ( = mc)Tj 5 Ts (2)Tj 0 Ts (by Smedley)Tj 5 Ts (TM)Tj 0 Ts ET 

. . . oder weitaus schlimmer, wenn Ihr Wasserzeichen farblich verstärkt wird!

Nachdem ich all dies bemerkt habe, werde ich auch feststellen, dass PDFtk eine GUI-Version hat, die vorgibt, Wasserzeichen in Anbetracht einer Lizenzgebühr von 4 US-Dollar zu behandeln. Überhaupt nicht teuer!

Andererseits finde ich, dass seine Website derzeit volle Unterstützung für O / S durch Windows 8und anbietet OS X 10.8 Mountain Lion. Dieser Jahrgang ist vor über 4 Jahren. Könnte PDFtk veraltet sein? Ich vermute nicht, aber ich weiß es nicht.

Vielen Dank für die PDFtk-Empfehlung, sieht ordentlich aus, aber "riecht" ja auch etwas laut. Die kostenlose Version ist 2.02, und Wikipedia sagt, dass das vor 3 Jahren tatsächlich veröffentlicht wurde: https://en.wikipedia.org/wiki/PDFtk Shiki vor 8 Jahren 0
@Shiki - Ich habe zwar ernsthaft nach PDF-Formaten recherchiert, meine detaillierte Bewertung des PDF-Fortschritts in den letzten 10 Jahren jedoch verworfen. * Hier die Zusammenfassung: * "Defizite einer 3-jährigen _PDFtk_-Version im Hinblick auf die Entwicklung von PDF-Spezifikationen." Während es seit 2005 mehrere Aktualisierungen gab, werden Sie mit _PDFtk_ aller Wahrscheinlichkeit nach in Ordnung sein. Ich sage dies, nachdem ich einige allgemein verfügbare, moderne PDF-Dokumentquellen geprüft habe. Alle von mir geprüften PDF-Dokumente wurden nach PDF-Standards vor 2010 erstellt (_well before, _ eigentlich.). Wenn Sie Zweifel haben, überprüfen Sie die oberen Dutzend Bytes der betreffenden PDF-Datei. Der Schley vor 7 Jahren 1
0
Crystal Wang

Hier sind kostenlose und kostenpflichtige Möglichkeiten, dies zu tun. Ich schlage vor, Sie verwenden Google Drive.

Google Drive kann Dateien öffnen und geringfügig bearbeiten. Es kann auch verwendet werden, um Wasserzeichen online aus PDF zu entfernen.

  1. Öffnen Sie Ihr Google Drive-Konto. Dies ist im Wesentlichen das gleiche wie Ihr Google Mail-Konto.
  2. Klicken Sie auf "Neu"> "Datei hochladen", wählen Sie ein PDF-Dokument aus und laden Sie es hoch.
  3. Wenn Sie fertig sind, können Sie die hochgeladene Datei auf Ihrem Laufwerk überprüfen und dann mit der rechten Maustaste klicken, um sie mit „Google Docs“ zu öffnen.
  4. Danach wird Ihr Wasserzeichen automatisch entfernt. Um es zu speichern, gehen Sie zu „Datei“ und klicken Sie auf „Herunterladen als“. Wählen Sie dann „PDF-Dokument“.