Wie lassen sich umgedrehte (um 180 ° gedrehte) Seiten in einer PDF-Datei identifizieren?

441
Gryph

Ich habe Tausende von PDF-Dateien. Unsere gutherzige Person, die sie alle eingescannt hat, muss irgendwann glasig sein, weil einige Seiten auf den Kopf gestellt wurden.

Ich habe ausgerechnet, dass die manuelle Überprüfung aller dieser Seiten 12 Stunden in Anspruch nehmen wird. Dies wirkt sich nicht auf die Korrektur aus (es gibt auch ein digitales Etikett auf der rechten Seite nach oben, Bonuspunkte, wenn Sie herausfinden können, wie Sie dies beibehalten können!).

Jede Hilfe oder Idee, in welche Richtung gesucht wird, wäre sehr willkommen.

1

1 Antwort auf die Frage

2
JaredT

Wenn die Seite Text enthält, den Acrobats OCR verstehen kann, können Sie möglicherweise mit der Funktion "Text erkennen" auskommen, wie ich aus diesem Link erfahren habe .

Aus dem letzten Beitrag auf dieser Seite:

In Acrobat XI können Sie in dieser Datei Extras / Text erkennen / Aa verwenden, um Seiten für die OCR zu korrigieren, dh sie werden zu einem durchsuchbaren Dokument. Wenn ich dies bei mehreren manuell gescannten Dokumenten mit verkehrten Seiten durchführe, werden sie vom Deskew um 180 Grad gedreht, dh die Ausrichtung des manuellen Scans wird korrigiert.

10/10 für einfache Lösung. Meldet sich zurück, wenn dies tatsächlich funktioniert (auch wenn es langsam geht, wie zum Teufel). Gryph vor 6 Jahren 0
Bestätigt, dass dies bei meinem Sample funktioniert - das ist voller Geräusche und Zahlen, von Handschrift. Text, der bereits auf der rechten Seite liegt, kann er leider nicht erkennen und beibehalten, auch wenn der Text über die Adobe Bates-Nummerierung angewendet wurde. Für die Frage, die ich gestellt habe, ist dies jedoch zu 100% erfüllt. Gryph vor 6 Jahren 0
Scheiße, es funktioniert nicht voll. Hoffentlich erspart Ihnen das etwas Mühe! JaredT vor 6 Jahren 0