Abgesehen von VBA kann eine solche Anwendung mithilfe der API von OpenOffice entwickelt werden, um den Inhalt des Word-Dokuments zu lesen. Verarbeiten Sie es und exportieren Sie die Ergebnisse als CSV-Datei, um sie in einer Tabellenkalkulationsanwendung zu öffnen.
Es sind jedoch nur ein paar Codezeilen, wenn Sie mit einer Programmiersprache vertraut sind. In Python zum Beispiel können Sie das ganz einfach so machen:
Hier definieren wir eine einfache Funktion, die Wörter zählt, denen eine Liste zugeordnet ist
def countWords(a_list): words = {} for i in range(len(a_list)): item = a_list[i] count = a_list.count(item) words[item] = count return sorted(words.items(), key = lambda item: item[1], reverse=True)
Der Rest besteht darin, den Inhalt des Dokuments zu bearbeiten. Zuerst fügen Sie es ein:
content = """This is the content of the word document. Just copy paste it. It can be very very very very long and it can contain punctuation (they will be ignored) and numbers like 123 and 4567 (they will be counted)."""
Hier entfernen wir die Interpunktion, EOL, Klammern usw. und erstellen dann eine Wortliste für unsere Funktion:
import re cleanContent = re.sub('[^a-zA-Z0-9]',' ', content) wordList = cleanContent.lower().split()
Dann führen wir unsere Funktion aus und speichern ihr Ergebnis (Wortzahlpaare) in einer anderen Liste und drucken die Ergebnisse aus:
result = countWords(wordList) for words in result: print(words)
Das Ergebnis ist also:
('very', 4) ('and', 3) ('it', 3) ('be', 3) ('they', 2) ('will', 2) ('can', 2) ('the', 2) ('ignored', 1) ('just', 1) ('is', 1) ('numbers', 1) ('punctuation', 1) ('long', 1) ('content', 1) ('document', 1) ('123', 1) ('4567', 1) ('copy', 1) ('paste', 1) ('word', 1) ('like', 1) ('this', 1) ('of', 1) ('contain', 1) ('counted', 1)
Sie können Klammern und Kommas mit Suchen / Ersetzen entfernen, wenn Sie möchten.
Alles, was Sie brauchen, um Python 3 herunterzuladen, zu installieren, IDLE zu öffnen (wird mit Python geliefert), den Inhalt Ihres Word-Dokuments zu ersetzen und die Befehle nacheinander und in der angegebenen Reihenfolge auszuführen.