Meiner Meinung nach ist der beste Weg, um diese Aufgabe zu erfüllen, nicht die Verwendung eines grafischen Benutzeroberflächenprogramms, sondern die Verwendung einer Sammlung von Bash-Skripts (wie in einer Unix / Linux-Umgebung). Wenn Sie also über grundlegende Programmierkenntnisse verfügen, können Sie dies tun viel mehr zu tun, was ein GUI-Programm für Sie bereitstellen kann.
Sie können zunächst eine minimale Unix-ähnliche Befehlszeile installieren, die Sie verwenden können
Ich bevorzuge Cygwin, da es eine riesige Menge an Softwarepaketen enthält.
Wenn Sie ein Bild aus einer PDF-Installation extrahieren möchten, ist auch pdfimages pdfimages ein Open Source-Befehlszeilenprogramm zum Extrahieren von Bildern aus PDF-Dateien. Es ist als Teil von poppler-utils und xpdf-utils frei verfügbar und standardmäßig in vielen Linux-Distributionen enthalten.
$ pdfimages file.pdf foo
Diese Verwendung erzeugt eine Reihe von nummerierten Bildern mit "foo" als Präfix.
Verwenden Sie tatsächlich $ mkdir temp $ mkdir temp / jpg
einen temporären Ordner namens jpg in einem temporären Verzeichnis erstellen
$ pdfimages -j file.pdf temp/jpg/foo
Nehmen wir an, Sie haben jetzt mehrere fooXXXX.jpg-Bilder im temporären Ordner.
In Ihrem Fall hatten Sie schon Bilder von fooXXXX.jpg.
Sie können jetzt eine PDF-Datei mit convert erstellen (eine Befehlszeile von ImageMagick).
Laden Sie also ImageMagick http://www.imagemagick.org/ herunter oder installieren Sie es mit dem Cygwin Package Manager
Schauen Sie sich die Dokumentation zum Konvertieren an (geben Sie "ImageMagick convert" in Ihre bevorzugte Suchmaschine ein).
Sie verstehen also, dass Sie zum Konvertieren Ihrer Bilder in eine PDF-Datei schreiben müssen
$ convert -compress jpeg temp/*.jpg my_output_file.pdf
Das ist alles ... ;-) aber diese Lösung lässt sich erweitern ...
Stellen wir uns vor, dass die gescannten Bilder aus einem Buch stammen ... 1 Datei enthält 2 Seiten Ihres Buches ...
Wenn Sie also 10 Dateien haben ... hatte Ihr Buch 20 Seiten ... und Sie möchten, dass Ihr PDF auch 20 Seiten hat.
Sie müssen also das in einer Datei enthaltene Bild aufteilen, um 2 Dateien für jede Seite zu erstellen.
Nehmen wir an, Ihre Datei ist temp / foo0001.jpg. Sie haben 2 Dateien temp2 / foo0001a.jpg (linke Seite) und temp2 / foo0001b.jpg (rechte Seite).
Erstellen Sie das Temp2-Verzeichnis (wo Ihre geschlitzten Dateien gespeichert werden sollen)
$ mkdir temp2 $ mkdir temp2/jpg
Erstellen Sie eine Datei mit dem Namen split_jpg_minw.sh mit einem Texteditor (Emacs, VI oder wenn Sie die Windows-Anwendung bevorzugen, können Sie Notepad oder Notepad ++ verwenden).
minimal_width=1500 minimal_width_ignore=10 rm temp2/jpg/*.jpg for f in temp/jpg/*.jpg do f2=$(basename $f) read -r width height <<< $( convert $f -format "%w %h" info:) width2=$(( $ / 2 )) height2=$ if [ $width -gt $minimal_width ]; then echo "split $f $x$ to 2 files $x$" convert $f -crop $x$+0+0 +repage temp2/jpg/$a.jpg convert $f -crop $x$+$width2+0 +repage temp2/jpg/$b.jpg else if [ $width -gt $minimal_width_ignore ]; then # ignore if with < 10px echo "copy $f $x$ (don't split because width<$minimal_width)" cp $f temp2/jpg/$f2 else echo "ignore $f $x$ width=$width<minimal_width_ignore=$minimal_width_ignore" fi fi do
width = 1500px ist die Grenze zum Teilen einer Datei (oder nicht)
- Eine Datei mit einer Breite von mehr als 1500 Pixeln wird aufgeteilt
- Eine Datei mit einer Breite unter 1500px wird nicht geteilt
Machen Sie dieses Skript ausführbar
$ chmod +x split_jpg_minw.sh
(Sie können die Tabulatortaste verwenden, um den Namen der Datei automatisch zu vervollständigen.)
Führen Sie das Skript aus
$ ./split_jpg_minw.sh
Die aufgeteilten Dateien befinden sich im Ordner temp2 / jpg
Erzeugen Sie die neue "aufgeteilte" Datei.
$ convert -compress jpeg temp2/*.jpg my_output_file_splitted.pdf
Sie können Ihrer Kette viel mehr Optionen hinzufügen, um PDF-Dateien mithilfe von Bash-Skript zu erzeugen.
Es gibt keine Begrenzung ... Sie müssen nur Skripts lernen (aber einige Codebeispiele sind manchmal viel nützlicher als Bücher).
Sie können beispielsweise einen Filter auf Ihre Bilder anwenden, bevor Sie die PDF-Datei erstellen (um beispielsweise Moiré-Muster zu entfernen oder Rauschen zu reduzieren), indem Sie Befehlszeilen-Tools wie G'MIC verwenden