Für bildbasierte Wasserzeichen gibt es mehrere Tools, die deren automatische Entfernung versprechen. Zum Beispiel:
Alle können kostenlos getestet werden, erfordern jedoch eine Lizenz, um die gewünschte Ausgabe tatsächlich zu erzeugen.
Das Wasserzeichen dieser spezifischen PDF-Datei (die mir das OP per E-Mail gesendet hat) ist jedoch kein einzelnes Bild, das auf allen Seiten wiederholt wird. Es stellt sich heraus, dass PDFCreator es (fast Pixel für Pixel) in jeden einzelnen von ihnen hartcodiert hat. Dadurch wird das Entfernen des Wasserzeichens wesentlich schwieriger (und es entsteht eine aufgeblähte PDF-Datei).
Da das Wasserzeichen eigentlich aus vielen kleinen Bildern besteht, können Sie diese mit einem PDF-Editor (z. B. Foxit Advanced PDF Editor ) entfernen, indem Sie sie einfach auswählen und drücken Delete. Leider müssen Sie dies für jede Seite wiederholen.
Eine weniger zeitaufwendige Lösung wäre das programmgesteuerte Entfernen des Wasserzeichens. Wir brauchen:
- Pdftk : Ein Werkzeug zum Komprimieren und Korrigieren von PDF-Streams.
- Notepad ++ : Ein Texteditor, der Perl-kompatible reguläre Ausdrücke ersetzen kann .
Schritte
Laden Sie Pdftk herunter und entpacken Sie pdftk.exe und libiconv2.dll nach % windir% \ System32, einem Verzeichnis im Pfad oder an einem anderen Ort Ihrer Wahl.
Laden Sie Notepad ++ herunter und installieren Sie es.
PDF-Streams werden normalerweise mit dem DEFLATE- Algorithmus komprimiert . Das spart Platz, macht die Quelle der PDF-Datei jedoch unleserlich.
Der Befehl
pdftk original.pdf output uncompressed.pdf uncompress
dekomprimiert alle Streams, sodass sie mit einem Texteditor geändert werden können.
Öffnen Sie uncompressed.pdf mit Notepad ++, um die Struktur des Wasserzeichens anzuzeigen.
In diesem speziellen Fall beginnt jede Seite mit dem Block
q 9 0 0 9 2997 4118.67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q
und fast 4000 Blöcke genau wie dieser. Dieser bestimmte Block legt nur eines (
/W 1 /H 1
) der Pixel des Wasserzeichens fest.Wenn Sie nach unten scrollen, bis sich das Muster ändert, wird angezeigt, dass der Stream des Wasserzeichens 95.906 Byte lang ist (Zeilenumbrüche zählen). Der gleiche Stream wird auf jeder Seite der PDF-Datei wiederholt.
Drücken Sie Ctrl+ Hund stellen Sie Folgendes ein:
Find: q 9 0 0 9 2997 4118\.67 cm. Replace: (blank) Match case: checked Wrap around: checked Regular expression: selected . matches newline: checked
Der reguläre Ausdruck
q 9 0 0 9 2997 4118\.67 cm.
stimmt mit der ersten Zeile des obigen Blocks (q 9 0 0 9 2997 4118.67 cm
) und allen folgenden 95.881 Zeichen überein, dh dem Stream des Wasserzeichens.Wenn Sie auf Alle ersetzen klicken, wird es von allen Seiten der PDF-Datei entfernt.
Das Wasserzeichen wurde jetzt entfernt, aber die PDF-Datei enthält Fehler (die Längen der Streams sind falsch) und ist nicht komprimiert.
Der Befehl
pdftk uncompressed.pdf output nowatermark.pdf compress
kümmert sich um beides.
uncompressed.pdf wird nicht mehr benötigt. Sie können es löschen.
Das Ergebnis ist das gleiche PDF ohne Wasserzeichen (und etwa die Hälfte der Größe).