Extrahieren Sie PDF-Daten mit kategorisierten Anmerkungen
438
bman
Gibt es bereits vorhandene Tools zum Extrahieren von Daten aus PDF-Dateien mit dieser Methode? Sagen wir, ich habe 3 Kategorien
- Bild - Dies ist eine Rechteck-Annotation, die den bestimmten Bereich beschneiden wird, in dem die Annotation platziert wird
- Titel - Dies ist ein weiteres Rechteck, das den Text innerhalb dieses Rechtecks nur annimmt. Bei einem Bild wird es durch OCR in Text umgewandelt
- Autor - dasselbe mit # 2, aber jetzt dem Autor zugeordnet
Dann wird ein Dateiformat erzeugt, sagen wir eine CSV:
ImageURL,Title,Author
Diese Kategorien (Felder) sollten auch zu Datensätzen gruppiert werden, so dass pro Zeile 1 Datensatz vorhanden ist.
Wenn es kein vorhandenes Werkzeug dafür gibt, welche Werkzeuge oder Programmier-API / SDK könnten mir dabei helfen, eines zu erstellen?
0 Antworten auf die Frage
Verwandte Probleme
-
14
PDF Viewer unter Windows
-
8
Firefox PDF-Plugin zum Anzeigen von PDF-Dateien im Browser unter Windows
-
17
So drucken Sie Dokumente als PDF
-
2
Firefox zum Drucken von PDF-Schriftarten
-
4
PDF Reader für iPhone
-
8
Software, um Audio von Heim-DVDs zu erhalten?
-
6
Entpacken einer ZIP-Datei in Programmdateien (x86)
-
16
Abfragen einer CSV-Datei
-
6
Adobe Reader: Kennwort für eine PDF-Datei merken
-
4
Kann ich einer PDF-Datei eigene Lesezeichen / Registerkarten hinzufügen?