Text aus dem PDF entfernen

3782
DrYap

Ich habe eine PDF-Datei mit Text auf jeder Seite, die ich entfernen möchte.

Der Text ist mit einem Regex abgestimmt, und ich denke, er kommt in einem Block des PDFs.

Ich habe pdfedit verwendet, um den Text mit der grafischen Benutzeroberfläche auszuwählen und zu löschen, aber ich suchte nach einer Möglichkeit, dies vom Terminal aus zu tun.

7

2 Antworten auf die Frage

6
MariusMatutiae

Sie können pdftk ausprobieren, aber es funktioniert nur zu einem Bruchteil der Zeit, da ein Problem mit Schriftarten (glaube ich) vorliegt .

Es funktioniert so: Zuerst müssen Sie die pdf-Datei dekomprimieren,

 pdftk myfile.pdf output unc.pdf uncompress 

dann modifizierst du es mit

 sed 's/oldstring/newstring/g' < unc.pdf > mod_unc.pdf 

Zuletzt komprimierst du es mit

 pdftk mod_unc.pdf output myfile_modified.pdf compress 

Ich habe mit diesem Befehl nur mäßigen Erfolg gehabt, in dem Sinne, dass er manchmal funktioniert, manchmal nicht, je nach Laune.

Ich habe es versucht, aber das Dekomprimieren verwandelte den Großteil des Textes in Weiß, der jedoch nie wiederhergestellt wurde. Komischerweise war der einzige Text, der nicht weiß war, das, was ich versuche loszuwerden !!! Danke für den Vorschlag. DrYap vor 10 Jahren 0
Sie können auch 'qpdf' verwenden: `qpdf --stream-data = uncompress myfile.pdf unc.pdf`. Eugene Pakhomov vor 6 Jahren 0
@ Eugene: Eugene, das hat mir die Textebene nicht entfernt ... Maxim vor 6 Jahren 0
Marius, pdftk ist leider keine Open Source mehr. - kennen Sie eine andere Lösung? Vielen Dank. Maxim vor 6 Jahren 0
@ Maxim Ich habe es immer noch in meinen Debian-Repos (und Ubuntu-Repos), was bedeutet, dass die für Linux-Benutzer verfügbare Version sicherlich Open Source ist. Warum sagst du, es ist nicht mehr FOSS? Es gibt kostenlose und kostenpflichtige Versionen, jedoch für Benutzer von Windows und MacOS. MariusMatutiae vor 6 Jahren 0
-3
sareeshmnair

Sie können beliebige PDF-Editoren verwenden. Nitro PDF ist ein gutes Werkzeug zum Bearbeiten von PDF. Es gibt auch so viele kostenlose Tools. Sie können damit Text hinzufügen oder entfernen.

http://www.nitropdf.com/free-pdf-software

PDFEdit ist eine gute Option für Linux. Lesen Sie diesen Link, um zu erfahren, wie man installiert. cyberciti.biz/tips/open-source-linux-pdf-writer.html

Das OP ist unter Linux und sie sagten, dass sie bereits PDFEdit verwendet haben. Bitte lesen Sie die Frage, bevor Sie eine Antwort posten. slhck vor 10 Jahren 1