Wenn eine PDF-Datei nur ein gescanntes Bild enthält, ist dies nur ein JPG-Bild in einem PDF-Container?

628
RockPaperLizard

Viele Scanner können eine Seite in eine PDF-Datei scannen.

Ist die PDF-Datei dann wirklich nur ein Container, der ein einzelnes Bild enthält? Ist dieses Bild normalerweise ein JPG-Bild, ein PDF-Bild oder ein proprietäres Format?

3
Ich hoffe wirklich, dass Ihr Scanner kein JPEG produziert, weil dies aufgrund der von ihm erzeugten Artefakte das schlechteste Format ist, das Sie für Scans verwenden können. Aber das ist Teil der Scannersoftware. Wenn ich mich recht erinnere, handelt es sich um ein PDF-Bild mit der angegebenen Komprimierung. Wenn Sie versuchen, die PDF-Datei zu interpretieren, erhalten Sie die erforderlichen Informationen sowie Metadaten. Max Wyss vor 8 Jahren 0
@ MaxWyss - Während JPG Artefakte erstellt, ist JPG oft ein lohnender Kompromiss und kann oft recht brauchbare Dokumente mit einer kleineren Größe als GIF / PNG erstellen, während der Inhalt dennoch übermittelt wird. Ich würde es jedoch nicht für eine Tabelle mit sehr kleinen Schriftzeichen verwenden, da dies zu Problemen führen kann - http://www.dkriesel.com/de/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning davidgo vor 8 Jahren 0

1 Antwort auf die Frage

3
davidgo

Gemäß diesem Link reißt kein PDF das Bild auf und erstellt es neu - manchmal unter Verwendung der JPEG- oder JPEG2000-Kodierung.

Eine PDF-Datei speichert ein Bild normalerweise als separates Objekt (XObject), das die Binärdaten für das Bild enthält.

Es ist wichtig zu wissen, dass dies normalerweise kein Bild im Sinne eines Tif-, Jpg- oder Png-Bildes ist - es sind die binären Daten für die Pixel, der für das Bild verwendete Farbraum und Informationen zum Bild. Das Bild wird beim Erstellen des PDF-Dokuments auseinander gerissen, und verschiedene PDF-Erstellungstools können dasselbe Bild auf unterschiedliche Weise speichern.

Manchmal werden die Rohbilddaten an die für die Seite erforderliche Größe angepasst und manchmal nicht - in diesem Fall werden sie beim Zeichnen vergrößert oder verkleinert -, erstellen verschiedene PDF-Erstellungswerkzeuge PDF-Dateien auf unterschiedliche Weise.

Die tatsächlichen Pixeldaten können komprimiert werden, und eines der Komprimierungsformate (DCTDecode) ist das gleiche wie in einem JPEG (JPX ist das gleiche wie Jpeg2000). Wenn Sie diese Daten speichern, können sie als JPEG-Datei geöffnet werden. Möglicherweise müssen jedoch die Farbraumdaten hinzugefügt werden.

Dieses Bild wird dann in den PDF-Inhaltsstrom gezeichnet ... Einige Dinge, die dem Auge als Bild erscheinen, können auch aus mehreren Bildern oder gar nicht aus Bildern bestehen!

All dies bedeutet, dass Sie, wenn Sie Bilder aus einem PDF-Dokument extrahieren möchten, das Bild aus allen Rohdaten zusammenstellen müssen. Es wird nicht als vollständige Bilddatei gespeichert, sondern Sie können es einfach auslesen.

In den Scannern ist höchstwahrscheinlich kein JPEG2000 oder ähnliches eingebaut. Man kann also davon ausgehen, dass es sich um einfaches JPEG handelt. Das macht auch mein Ricoh MFP. Daniel B vor 8 Jahren 0
Welches Tool erstellt PDF-Dateien mit der Bildkomprimierung von jpeg2000? erik vor 8 Jahren 0