Gemäß diesem Link reißt kein PDF das Bild auf und erstellt es neu - manchmal unter Verwendung der JPEG- oder JPEG2000-Kodierung.
Eine PDF-Datei speichert ein Bild normalerweise als separates Objekt (XObject), das die Binärdaten für das Bild enthält.
Es ist wichtig zu wissen, dass dies normalerweise kein Bild im Sinne eines Tif-, Jpg- oder Png-Bildes ist - es sind die binären Daten für die Pixel, der für das Bild verwendete Farbraum und Informationen zum Bild. Das Bild wird beim Erstellen des PDF-Dokuments auseinander gerissen, und verschiedene PDF-Erstellungstools können dasselbe Bild auf unterschiedliche Weise speichern.
Manchmal werden die Rohbilddaten an die für die Seite erforderliche Größe angepasst und manchmal nicht - in diesem Fall werden sie beim Zeichnen vergrößert oder verkleinert -, erstellen verschiedene PDF-Erstellungswerkzeuge PDF-Dateien auf unterschiedliche Weise.
Die tatsächlichen Pixeldaten können komprimiert werden, und eines der Komprimierungsformate (DCTDecode) ist das gleiche wie in einem JPEG (JPX ist das gleiche wie Jpeg2000). Wenn Sie diese Daten speichern, können sie als JPEG-Datei geöffnet werden. Möglicherweise müssen jedoch die Farbraumdaten hinzugefügt werden.
Dieses Bild wird dann in den PDF-Inhaltsstrom gezeichnet ... Einige Dinge, die dem Auge als Bild erscheinen, können auch aus mehreren Bildern oder gar nicht aus Bildern bestehen!
All dies bedeutet, dass Sie, wenn Sie Bilder aus einem PDF-Dokument extrahieren möchten, das Bild aus allen Rohdaten zusammenstellen müssen. Es wird nicht als vollständige Bilddatei gespeichert, sondern Sie können es einfach auslesen.