Wie entferne ich ein Wasserzeichen aus PDF mit pdftk?

33318
hnns

Ich muss ein dummes E-Mail-Wasserzeichen entfernen, das sich über alle Seiten eines Public Domain-Buches erstreckt. Ich habe mir die pdftk-Manpage und einige Beispiele angesehen, kann aber immer noch nicht herausfinden, wie man die Wasserzeichen entfernt. Ich freue mich über Ihre Hinweise.

31

3 Antworten auf die Frage

44
Philippe

Nur ein kleiner Zusatz zu Dingos Antwort, da es für mich nicht funktionierte:

Ich musste das PDF-Dokument zuerst dekomprimieren, um das Wasserzeichen finden und durch ersetzen zu können sed. Der erste Schritt umfasst das Dekomprimieren des PDF-Dokuments mit pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

Jetzt uncompressed.pdfkann das wie in Dingos Antwort verwendet werden:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf 

Ich habe das Dokument dann repariert und erneut komprimiert:

pdftk unwatermarked.pdf output fixed.pdf compress 
Du bist ein Lebensretter! Vielen Dank!!! :) johndodo vor 10 Jahren 0
Das ist wirklich großartig! qed vor 10 Jahren 1
Ich nahm diesen Prozess, machte ihn etwas schicker und wickelte ihn in ein Python-Skript ein. Es ist auf github [hier] (https://github.com/agarden/remove-pdf-watermark/tree/master). Alexander Garden vor 10 Jahren 4
@Alexander Garden Es funktioniert nicht, `TypeError: str () benötigt höchstens 1 Argument (2 gegeben)`, wenn es gemäß den gegebenen Verwendungshinweisen verwendet wird 8bitjunkie vor 8 Jahren 0
@ 8bitjunkie Kannst du ein Github-Problem mit einem vollständigen Stack-Trace öffnen? Alexander Garden vor 8 Jahren 0
Ich hatte Probleme mit diesem Ansatz, weil pdftk die Datei "unbenutzte.pdf" nicht öffnen konnte. Der Trick bestand darin, den watermarktextstring via sed durch einen Ersatzstring zu ersetzen, der nur N Leerzeichen war, wobei N die Länge des ursprünglichen Wasserzeichens ist. Vergewissern Sie sich also, dass Ihre unkomprimierte.pdf und die nicht mit Wasserzeichen versehenen.pdf die gleiche Länge haben gdecaso vor 7 Jahren 0
+1 Ich habe stattdessen den sed-Befehl `/ watermarktextstring / d` verwendet, weil mein Wasserzeichen-String mit Formatierungsanweisungen oder typografischen Hinweisen oder ähnlichem verschachtelt war. David Foerster vor 6 Jahren 0
@Philippe Der zweite Befehl gibt einen Fehler aus: "sed: RE error: unzulässige Bytefolge". Was soll ich tun? Karlo vor 6 Jahren 0
Da qpdf in vielen Distros das Standardwerkzeug ist, können Sie [hier] (https://unix.stackexchange.com/a/17713/29426) mit qpdf dekomprimieren. akhan vor 5 Jahren 0
@Philippe eine Idee, wie man Wasserzeichen im Stapel entfernen kann? Clain Dsilva vor 5 Jahren 0
34
Dingo

sehr einfach zu erledigende Aufgabe:

benutze sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf 

Stellen Sie anschließend sicher, dass Sie die resultierende Ausgabe im PDF- Format reparieren

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf 

alles in einem Befehl:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf 

Textwasserzeichen sind nichts anderes als ein Text zwischen zwei Tags im komprimierten PDF-Code

Fantastic! worked like a charm. please just rename the email address to a fictitious one. I don't want the guy how spoiled the book be targeted by spammers. Specially as he is probably the one who has made the pdf. Many thanks. hnns vor 11 Jahren 1
erledigt! Bestimmte Zeichenfolge mit einer generischen Zeichenfolge geändert vor 11 Jahren 0
Kann jemand diese Lösung ändern, um ein Link-Wasserzeichen zu entfernen? Ich habe den Text los, aber es gibt immer noch ein kleines Quadrat, in dem sich der Text befand. 425nesp vor 10 Jahren 0
pdftk stürzte ab, als ich das lief. Cerin vor 5 Jahren 0
@Dingo wie kann es im Batch verarbeitet werden? Ich meine mehrere Dateien Clain Dsilva vor 5 Jahren 0
Mehrere Dateien mit der gleichen zu ersetzenden Zeichenfolge oder unterschiedliche Zeichenfolgen für jede Datei? Dingo vor 5 Jahren 0
-3
user549273

So entfernen Sie www.it-ebooks.info

Öffnen Sie die PDF-Datei in Notepad ++ oder im Textpad

Ersetzen Sie www.it-ebooks.info durch nichts (leer)

Speicher die Datei

Offen im Standard-Adobe-Reader

Beenden, werden Sie aufgefordert, die Datei zu speichern

Speichern Sie es

Ist das eine generelle Lösung? Was ist www.it-ebooks.info? Karlo vor 6 Jahren 1