Reduzieren stark gescannter PDF-Dateien (nur OCR beibehalten und gescanntes Bild entfernen)
430
Enora
Ich habe ein stark gescanntes PDF mit OCR. Ich konnte seine Größe mit ghostscript win64 um die Hälfte reduzieren, mit diesem Befehl (wie in dieser Antwort empfohlen ):
gswin64 -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf
Aber es ist immer noch nicht leicht genug.
Ich könnte das PDF auch mit Calibre oder pdftotext von xpdf konvertieren, aber ich verliere das Layout.
Gibt es eine Möglichkeit, die OCR zu extrahieren, wobei die genaue Position jedes Texts auf jeder Seite beim Entfernen des gescannten Bildes berücksichtigt wird?
0 Antworten auf die Frage
Verwandte Probleme
-
14
PDF Viewer unter Windows
-
8
Firefox PDF-Plugin zum Anzeigen von PDF-Dateien im Browser unter Windows
-
4
Wie kann ich ein ISO-CD-Image auf einem Mac in das bin / cue-Format konvertieren?
-
17
So drucken Sie Dokumente als PDF
-
2
Firefox zum Drucken von PDF-Schriftarten
-
4
PDF Reader für iPhone
-
5
Wie kann ich ein Video nach 3GP konvertieren?
-
5
Wie kann ich eine Powerpoint-Präsentation in eine Videodatei (AVI oder WMV) konvertieren?
-
4
Befehlszeilen-Videokonvertierungstools
-
11
Wie konvertiere ich eine animierte GIF in ein YouTube-freundliches Videoformat?