Reduzieren Sie Auflösung, Größe, dpi und Anzahl der Pixel in PDF-Bildern

2146
flen

Ich habe einen Text mit 600 dpi gescannt und es stellte sich heraus, dass er weitaus mehr war, als ich brauchte, um daraus ein PDF zu erstellen. Ich habe den Text bereits OCR erstellt und möchte die OCR im PDF beibehalten.

Ich möchte die Anzahl der Pixel verringern (dpi? Sorry, ich bin mir nicht sicher, wie ich sie nennen würde, ich bin nicht an die Bildverarbeitung gewöhnt), sodass ich die PDF-Größe verkleinern kann. Die Bilder sind zu groß, wenn ich die PDF-Datei öffne. Es wäre gut, sie zu verkleinern, indem die Anzahl der Pixel verringert wird (wie es jetzt der Fall ist, kann ich die Bilder viel mehr vergrößern, als ich brauche).

Wie kann ich die Bildgröße verkleinern, indem Sie die Anzahl der Pixel (dpi) verringern?

Ich möchte die PDF-Datei nicht erneut drucken oder erneut scannen, da ich die OCR nicht verlieren möchte. Ich habe mit Adobe Acrobat Pro DC "Als optimiertes PDF speichern" ausprobiert und alle Bilder über 50 dpi auf 50 dpi verkleinert. Es hat das PDF größer gemacht! (Ich denke, das PDF ist bereits komprimiert; aber ich möchte keine Komprimierung, ich möchte die Anzahl der Pixel / die Auflösung reduzieren.)

Ich bin unter Windows 7 64 Bit

0
Aber jetzt denke ich ... Ist es möglich, die Bildlänge / Auflösung zu reduzieren und die OCR zu erhalten? Dies ist möglicherweise unmöglich, da die OCR nicht mit der Textposition im Bild korreliert flen vor 6 Jahren 0
Übrigens, OCR ist in der Regel für ca. 300 dpi. Wenn Sie wirklich winzigen OCR-Text erstellen möchten, können Sie mit einer höheren Auflösung scannen. Wenn Sie jedoch normalen Text mit 600 dpi nur für OCR-Zwecke scannen, werden Sie nur eine große Datei kaufen. fixer1234 vor 6 Jahren 0

2 Antworten auf die Frage

1
jiggunjer

Ich glaube, Sie waren mit Acrobat Pro auf dem richtigen Weg.

Sie müssen jedoch die tatsächliche Bildauflösung ändern. Sie können dies tun, indem Sie manuell eine Version mit niedriger Auflösung (z. B. 50% B x 50% H) erstellen und das vorhandene Bild in der PDF-Datei durch ein neues ersetzen. In diesem Fall müsste die Bildauflösung innerhalb des PDF-Dokuments ebenfalls halbiert werden, um die Größe zu erhalten. Wenn Sie dieselbe dpi beibehalten, wird ein Viertel der Größe angezeigt.

Solange sich die Dokumentmaße nicht ändern, sollte der OCR-Text denselben Raumkoordinaten zugeordnet werden.

Bearbeiten: Stapelverarbeitung mit Acrobat Pro

Unten sehen Sie, dass Acrobat Pro (XI) die Bildeigenschaften anzeigen kann. 123

  1. Sobald ein Bild Teil eines PDF-Dokuments ist, erhält es auf dem "virtuellen Papier" eine physische " Größe ".
  2. Ppi (oder dpi, aber mehr für das Drucken von Kontexten) ist eine PDF-Metrik, die das Verhältnis zwischen physischer Größe und Anzahl der Pixel angibt . Ich glaube, dass die Einheit pt / inch im Bild falsch ist. es sollte ppi sein. Ich denke auch, es ist eine schlechte Wortwahl, wenn man es Auflösung nennt.
  3. Die tatsächliche Bildauflösung (width hight) ist eine pdf-unabhängige Bildeigenschaft. Sie bestimmt, wie groß die Datei ist und wie viel Sie beim digitalen Betrachten sinnvoll vergrößern können.

Es gibt eine einfache mathematische Beziehung: 2 = 3/1.

  • Sie möchten 3 reduzieren, während Sie 1 konstant halten, wodurch 2 implizit um einen entsprechenden Betrag reduziert wird.
  • Die meisten Editoren verwenden die Formulierung "dpi ändern", die praktisch gleich ist: Ändern Sie 2 und stellen Sie implizit 3 so ein, dass 1 die gleiche Größe hat.
  • Unter der Haube tritt jedoch die größte Änderung in der Bildauflösung auf (3), das ppi / dpi ist nur eine Zahl, die im PDF aktualisiert werden muss; also finde ich meine worte besser :)

Im Folgenden können Sie eine Art "intelligenter Filter" für Ihre PDF-Dateien mit Acrobat Pro ausführen. Einer der verfügbaren voreingestellten Filter ist die Verringerung der Bildauflösung. Sie können diese Preflight-Option also einfach ausführen oder Ihre eigene erstellen. Sie können Downscaling-Optionen und Bildkomprimierungsmethoden anpassen. Acrobat Pro

Ich denke, Sie können mehrere PDF-Dateien mit dieser Methode in Kombination mit dem "Aktionsassistenten" bearbeiten.

Gut durchdacht! Aber wie teile ich das Bild und halbiere die dpi, speziell für alle Bilder im Stapel (anstatt manuell für jedes Bild)? Gibt es vielleicht eine FOSS-Lösung? Oder sogar eine Lösung in Acrobat? flen vor 6 Jahren 0
Ich glaube, dass imagemagick oft für die Stapelverarbeitung dieser Art verwendet wird, aber selbst nie verwendet wurde. jiggunjer vor 6 Jahren 0
Ich denke, es wäre kein Problem, mit Bildern in Batches zu arbeiten (ich kann alle Bilder aller PDF-Seiten mit Acrobat exportieren). Das Problem wäre, sie später im PDF selbst zu ersetzen. Vielleicht kann ich die Acrobat-JavaScript-API dazu bringen, diese Bilder im Stapel zu ersetzen ... Ich muss sie mir ansehen. Aber wenn ich es manuell machen würde, wie würden Sie mir vorschlagen, die Version mit niedriger Auflösung zu erstellen und die dpi zu halbieren? Durch die Verwendung von Imagemagick? flen vor 6 Jahren 0
@flen Ich habe Informationen zur Verwendung von Acrobat aktualisiert. jiggunjer vor 6 Jahren 0
Vielen Dank!!! Es hat perfekt funktioniert! Ich habe den Standard-Preflight "Bildauflösung auf 150 ppi (Bitmaps auf 300 ppi) herunterskalieren" (in Acrobat DC Pro: unter Extras -> Druckproduktion -> Preflight -> PDF-Fixups) ausgeführt. Die PDF-Größe wurde auf weniger als ein Drittel der Originalgröße reduziert! Eine lustige Sache, ich habe zuvor versucht, ein "optimiertes PDF" zu speichern, das die Bilder auf 150ppi herabsetzen würde, aber die Größenreduzierung war minimal. Ich weiß nicht, warum "Preflight" und "Optimiertes PDF" so unterschiedlich waren flen vor 6 Jahren 0
0
Edi

Das PDF- Tool " Compress PDF" von Sejda optimiert die Bilder in Ihrem PDF-Dokument und ändert deren DPI- Wert entsprechend Ihrer Auswahl.

https://www.sejda.com/compress-pdf

Ändern Sie die DPI der Bilder in PDF mit Sejda compress PDF

Es gibt auch eine Desktop-App.

Ich bin einer der Entwickler.

Nett! Ich habe es gerade heruntergeladen, ich werde es versuchen flen vor 6 Jahren 0
Mein PDF-Format beträgt fast 100 MB, das überschreitet die 50-MB-Grenze für die kostenlose Desktop-Version. flen vor 6 Jahren 0