Wie kann man OCR-Dokumente mit der Tabelle erstellen und in Text exportieren (mit entsprechendem Text links / rechts / oben / unten)?
Ich habe ein Dokument mit vielen Seiten, das die folgenden Säulentabellen enthält.
#1 2.1 This is some text. It can go onto the next line like this. #2 1.3 More text. #3 3.2 And some more text that goes on to the next line also. #4 2.3 And some more text.
Wenn ich das Dokument OCR OCR mache, scheint es, die Spalten als separate Blöcke auf einigen Seiten und auf anderen Seiten OCR zu machen, wobei der gesamte Text als ein großer Block erfasst wird. In diesem Beispiel sagen wir, es wurde in 4 Blöcken aufgenommen, wie in der folgenden Abbildung gezeigt.
Beim Exportieren (oder Kopieren / Einfügen) exportiert Acrobat es also in Blockreihenfolge. So bekomme ich Text wie folgt.
#1 #2 #3 2.1 1.3 3.2 This is some text. It can go onto the next line like this. More text. And some more text that goes on to the next line also. #4 2.3 And some more text.
Wenn ich nach Word exportiere, sieht das Layout in Ordnung aus. Dies liegt jedoch daran, dass Acrobat das Word-Dokument mit Abschnitten und Spalten erstellt hat. In diesem Fall ein dreispaltiger Abschnitt bis zum Ende der Zeile # 3. Dann ein einspaltiger Abschnitt für Zeile 4. Wenn ich also von Word nach Text exportiere, ergibt sich das gleiche Ergebnis
Wie kann ich Acrobat auf OCR hinweisen oder den Text mit einfachen Links / Rechts / Oben / Unten exportieren, damit ich Text wie das Originaldokument bekomme (wie in meinem ersten Beispiel)? Vielen Dank!
Systeminformationen:
macOS 10.12.5 (16F73) Architecture: x86_64 Build: 17.9.20044.222436 AGM: 4.30.69 CoolType: 5.14.5 JP2K: 1.2.2.38123
0 Antworten auf die Frage
Verwandte Probleme
-
3
Welche Software kann Handschrift in Text umwandeln?
-
3
Acrobat: Festlegen der Standardschriftart für das Textfeld-Tool
-
3
Word-Formulare in PDF-Formulare konvertieren (ausfüllen)?
-
2
Öffnen Sie das FDF-Dokument auf dem Mac
-
5
Der Acrobat Reader 9 stürzt ab, sobald er geöffnet wird. Wie kann ich das debuggen?
-
3
Wie kann ich Schriftarten aus einem Bild erkennen?
-
3
Was ist eine gute Handschrifterkennungssoftware?
-
2
Kann ich den Acrobat Reader dazu bringen, ein geändertes PDF-Dokument neu zu laden?
-
9
Wie extrahiere ich Text mit OCR aus einem PDF unter Linux?
-
2
Verlust von Hyperlinks beim Konvertieren von PPT in PDF mit Adobe Acrobat Pro