Mit ImageMagick können Sie einen lauten Trimm durchführen, z. B .:
convert image-0001.png -virtual-pixel White -blur 0x15 -fuzz 15% -trim info:
Die Seite ist nicht leer, wenn die Konvertierung etwa so aussieht:
image-0001.png PNG 4565x6129 4960x7016+279+816 8-bit Gray 0.000u 0:00.000
(Als Beispiel wird ein DIN A4-Format mit 600 dpi gescannt.)
Es ist leer, wenn die Höhe / Breite nach dem Beschneiden verdächtig klein ist, z.
image-0001.png PNG 2505x40 4960x7016+0+6976 8-bit Gray 0.000u 0:00.000
Im Gegensatz zur Schwellenwert-Histogrammmethode führt dies zu weniger Fehlalarmen, wenn Sie Seiten haben, die nur ein Wort oder eine Textzeile enthalten. Mit einem Schwellenhistogramm können solche Seiten fälschlicherweise als leer erkannt werden.
Betrachtet man die Dateigröße des komprimierten Bildes, dh als Annäherung an die Entropie, erhält man die gleichen Fehlalarme.
Auf der anderen Seite werden Dokumente mit Perforationen, die aber sonst leer sind, wahrscheinlich nicht als leer erkannt, sondern nur mit einem lauten Beschnitt. Wenn Sie sich darum kümmern, kann es sinnvoll sein, ImageMagick vorab mitzuteilen, dass der Randraum unbedingt gekürzt wird. Wenn das Bild beispielsweise mit 600 dpi gescannt wurde und Sie einen 1-Zoll-Rand ringsum ignorieren möchten:
convert i1.png -shave 600x0 -virtual-pixel White -blur 0x15 -fuzz 15% -trim info: