Sie können ImageMagick verwenden. Die Option '-trim' beschneidet ein Bild so klein wie möglich und zeigt an, ob das Bild vollständig leer ist:
$ convert -trim no_text_images.eps foo.jpg convert-im6.q16: geometry does not contain image [...]
Da der convert
Befehl für diese Warnung keinen Fehlercode zurückgibt, muss Ihr Shellskript den stderr anzeigen.
if ! convert -trim no_text_images.eps foo.png 2>&1 | grep 'does not contain image'; then [ there's an image, so process it ] else [ there's no image ] fi
Jetzt, wo ich sehe, woran Sie gerade arbeiten, habe ich vielleicht eine einfachere Lösung für Sie. Warum versuchen Sie es nicht ocrmypdf
? Nur sudo apt install ocrmypdf
um es auf Ihrer Debian-Box zu installieren.
Ich habe es in der PDF-Datei ausgeführt, die Sie mir gegeben haben, und obwohl ich tesseract
Englisch eingestellt habe, hat es eine vernünftige Darstellung des Vektors erhalten, den Sie oben im Formular haben:
$ ocrmypdf --force-ocr --oversample 150 084.pdf foo.pdf $ pdftotext foo.pdf - | less Sigurd Otto M¢nsteds Va] Muller Vinhandel A/S Aalbors SV- Tlf. 98 18 50 99- E-mail: vin@smv.dk- www. smv. dk 53 92 79 12- Nordjyske Bank 7450- 2038354 2- 9200 CVR nr. Import, salg as distribution if Vin cg spiritus Eneiurhandler i Danmark af udsIgte vine fra hale verden.