Sie können die XPDF-Bibliothek unter http://www.foolabs.com/xpdf/download.html für Linux und Windows herunterladen . Dann laufen pdfimages -j input.pdf output
und Sie sollten erhalten output-000.jpg
, output-001.jpg
usw. Auch Besuche http://linuxcommand.org/man_pages/pdfimages1.html für weitere Nutzungsmöglichkeiten.
Hintergrundbilder aus einer PDF-Datei extrahieren?
Ich habe eine PDF-Datei mit Karten des Gebäudes, in dem ich arbeite, hier:
http://www.libsys.und.edu/dev/FloorPlans_All.pdf
Die ursprünglichen Quelldateien sind verloren gegangen, und ich wurde gebeten, die Kartenbilder zu extrahieren, vorzugsweise ohne den Text und die überlagerten Symbole. Das hat sich als ärgerlich erwiesen.
Bisher habe ich folgende GUI-Programme ausprobiert:
- Adobe Reader: Ermöglicht die Auswahl von Text, nicht jedoch der Hintergrundbilder
- FoxIt PDF Viewer: Ermöglicht die Auswahl von Text, nicht jedoch der Hintergrundbilder
- XPDF unter Ubuntu 10.10: Mit mes können Sie Text auswählen, nicht jedoch die Hintergrundbilder
Und auch die folgenden Befehlszeilenprogramme:
- pdfimages: extrahiert die Symbole, die auf Badezimmer hinweisen, aber nicht die Hintergrundbilder
- pdftohtml: Wie pdfimages, außerdem wird das HTML-Dokument schlecht markiert
- pdfextract: wie bei pdfimages
- convert: erfolgreich gespeicherte Bilder, jedoch mit dem eingebrannten Text
Ich habe sogar versucht, die PDF-Datei manuell in einem Texteditor zu öffnen und die Stream-Objekte zu extrahieren, indem Sie sie in eine neue Datei einfügen und mit der Erweiterung .jpg, .png oder .bmp speichern (jeweils einzeln). Wenn man bedenkt, wie wenig ich über die interne Struktur von PDF-Dateien weiß, ist es kein Wunder, dass dies nicht funktioniert hat.
Also ... gibt es eine Möglichkeit, die Kartenbilder von diesem Ding abzurufen, ohne auch den Text und die Symbole zu erhalten?
6 Antworten auf die Frage
- Beliebte
- Neu
- Mit Kommentaren
- Aktiv
Ok, nachdem ich 5 Minuten damit herumgespielt habe, ist meine Analyse, dass PDF noch seltsamer ist, als ich ursprünglich dachte, und das sagt etwas.
Sie wissen nicht, wie hoch Ihr Budget ist, aber mit Acrobat Pro Extended 9 können Sie Folgendes verwenden:
A. Extras, Erweiterte Bearbeitung, Touchup-Textwerkzeug
-Select All -Right click, Properties -Text tab -Select a standard font (e.g. Arial), close -Hit Delete
B. Extras, Erweiterte Bearbeitung, Touchup-Objektwerkzeug
-Wählen Sie das Objekt aus (Sie können die meisten, aber nicht alle davon erhalten (z. B. Symbole für Schülercomputer können nicht ausgewählt werden), und dann löschen
So sah Page 1 nach einer schnellen Bereinigung aus: http://dl.dropbox.com/u/7434256/p1test.pdf
Nehmen Sie das von Craig H erstellte PDF und optimieren Sie es ein wenig, indem Sie es durch Ghostscript laufen lassen. Unter Windows lautet die Befehlszeile:
gswin32c.exe ^ -o p1test-gs-optimized.pdf ^ -sDEVICE=pdfwrite ^ -dPDFSETTIINGS=/prepress ^ p1test.pdf
Unter Linux / Unix / Mac OS X:
gs \ -o p1test-gs-optimized.pdf \ -sDEVICE=pdfwrite \ -dPDFSETTIINGS=/prepress \ p1test.pdf
Dadurch wird die Dateigröße von 3.000 kByte auf etwa 60 kByte reduziert, ohne dass Inhalt verloren geht. Dann könnte der Import in Inkscape (oder InDesign, Illustrator, ...) wesentlich schneller sein.
... Sie könnten Photoshop ausprobieren. Es liest PDFs, und es ist "möglich", dass es aus PS stammt und möglicherweise noch die Ebenen hat ... aber es ist eine sehr lange Sicht.
In einer Linux-Umgebung habe ich pdfmod verwendet, um alle Bilder auf einmal zu extrahieren. Siehe https://wiki.gnome.org/Apps/PdfMod oder für Ubuntu-Benutzer https://apps.ubuntu.com/cat/applications/pdfmod/
Um es in Ubuntu herunterzuladen und zu installieren, genügt die Eingabe sudo apt-get install pdfmod
.
- Starten Sie die pdfmod-Benutzeroberfläche (geben Sie
pdfmod
das Dashboard oder das Befehlszeilenterminal ein). - Öffnen Sie das PDF-Dokument
- Wählen Sie alle Seiten aus (oder alle, von denen Sie die Bilder extrahieren möchten)
- Das Menüelement Bearbeiten bietet die Option, so viele Bilder zu extrahieren, wie sie innerhalb des ausgewählten Bereichs extrahiert werden können (
export n images
mit der entsprechenden Anzahl). Sie können auf diesen Befehl auch zugreifen, indem Sie mit der Maus auf die Auswahl zeigen und das lokale Menü aktivieren (Rechtsklick für Rechtshänder). - Wenn Sie damit fortfahren, wird ein neues Fenster geöffnet, in dem Sie den Speicherort für die Bilder auswählen.
Hoffe das hilft.
Öffnen Sie das Dokument auf Ihrem Bildschirm, vergrößern Sie das Bild, um es so groß wie möglich zu machen, aber es ist immer noch alles sichtbar. Drücken Sie alt + prnt scrn (oder das entsprechende unter Ihrem Betriebssystem) und es sollte ein Screenshot des Programms erstellt werden. Öffnen Sie nun Paint oder Ihren bevorzugten Bildeditor (Photoshop, Gimp usw.), fügen Sie das Bild ein und schneiden Sie alles heraus, was Sie nicht möchten.
Verwandte Probleme
-
14
PDF Viewer unter Windows
-
8
Firefox PDF-Plugin zum Anzeigen von PDF-Dateien im Browser unter Windows
-
17
So drucken Sie Dokumente als PDF
-
2
Firefox zum Drucken von PDF-Schriftarten
-
4
PDF Reader für iPhone
-
8
Software, um Audio von Heim-DVDs zu erhalten?
-
6
Entpacken einer ZIP-Datei in Programmdateien (x86)
-
6
Adobe Reader: Kennwort für eine PDF-Datei merken
-
4
Kann ich einer PDF-Datei eigene Lesezeichen / Registerkarten hinzufügen?
-
5
Welche Adobe Acrobat-Alternativen verfügen über PDF-Signaturfunktionen