Wie erstelle ich einen alphabetischen Index eines Word-Dokuments?

742
Filippo

Mein Chef gab mir ein PDF und bat darum, ein alphabetisches Verzeichnis zu erstellen.

Der Index enthält nur für ihn interessante Wörter. Die Liste der "interessanten Wörter" ist nicht verfügbar, und ich sollte eines erstellen und ihm zur Bestätigung zeigen.

Ich denke, ich kann einen Weg finden, die PDF- Datei in .doc umzuwandeln, und Libreoffice kann einen alphabetischen Index erstellen, sobald Sie ihm eine .sdi- Datei mit den 'interessanten Wörtern' geben.

Mein größtes Anliegen ist es nun, alle eindeutigen Wörter aus dem PDF-Format zu extrahieren, zu filtern, um die zu häufigen Wörter zu entfernen und die Liste der wichtigsten Wörter zu erstellen. Irgendwelche Vorschläge ? Muss ich eine einfache Anwendung schreiben, um die Wörter zu filtern, oder kann ich vorhandene Software verwenden?

Danke, Filippo

0

1 Antwort auf die Frage

-1
Zvi Twersky

Ja, Sie würden zu einem Dokument extrahieren, um Zugriff auf Text zu erhalten, und dann Software verwenden, um Schlüsselwörter zu analysieren und zu erhalten (oder wie Sie es formulieren - interessante Wörter).

TexLexAn ist eine gute Open Source-Option: http://texlexan.sourceforge.net/

Hier sind andere: http://www.quora.com/Was sind-guteWerkzeuge-zu- extrakten- Schlüssel-und-oder-Topics- tags-von- a-Random- Parameter-von-Text

Du bist ein beschäftigter Kerl. Sehen Sie sich diese Diskussion an, damit Sie nicht auf Software-Empfehlungen eingehen: http://meta.superuser.com/questions/5329/how-do-i-recommend-software-in-my-answers fixer1234 vor 9 Jahren 0
Leider hat Bill Gates für Windows keine Schaltfläche mit dem Titel "Klicken Sie hier, um interessante Wörter aus einer PDF-Datei zu extrahieren" angezeigt. Wenn Sie selbst kein Programmierer sind, ist Software manchmal die einzige Lösung. Mein Rat an Sie ist, sich auf die Bedürfnisse der Benutzer zu konzentrieren und auf die Antworten und Kommentare anderer zu verzichten. Zvi Twersky vor 9 Jahren 0