Microsoft Office-Schlüsselwortanalyse

1183
mmcglynn

Gibt es eine Software, die eine Keyword-Analyse für einen Stapel von Microsoft Word-Dateien durchführt? Mit anderen Worten, ich würde einfach gerne ein Wort für alle verwendeten Wörter zählen. Ziel ist es, Schlüsselwörter als Grundlage für die Erstellung einer Taxonomie zu identifizieren.

0
Dies ist sehr offen: Welche Art von Analyse wollten Sie? Clare Macrae vor 13 Jahren 0
aktualisierte Frage, um genauer zu sein. mmcglynn vor 13 Jahren 0
Mögliches Duplikat von: http://superuser.com/questions/251324/list-and-count-unique-words-from-a-word-document fixer1234 vor 8 Jahren 0

2 Antworten auf die Frage

1
Simon

Ich verwende ein Python-Skript, das das docx.pyModul (siehe hier ) verwendet, um Word-Dateien zu lesen und die einzelnen Wörter für eine verwandte Aufgabe zu verarbeiten. Die Schlüsselbits befinden sich im folgenden Code (der nur eine .docx-Datei liest, die als erstes Befehlszeilenargument angegeben wurde, die aber leicht erweitert werden kann, um Wörter in vielen Dateien zu zählen:

from docx import * import sys  try: document = opendocx(sys.argv[1]) except: print('Could not open '+sys.argv[1]) exit()  ## Fetch all the text out of the document  paratextlist = getdocumenttext(document)   count = {} for line in paratextlist: for word in line.rstrip().split(): count = count.get(word,0) + 1 
0
rlb.usa

Wie wäre es mit WordStat ?

Genau richtig. Ziemlich teuer, obwohl ~ 3000 $. mmcglynn vor 13 Jahren 0