Wie zähle ich die Anzahl der Zeichen in zahlreichen Kommentaren zu einer MS Word 2007-Datei?

359
CopperKettle

Ich hatte die Aufgabe, alle Kommentare in eine große MS Word-Datei zu übersetzen. Um eine Rechnung erstellen zu können, muss ich alle Zeichen (einschließlich Leerzeichen) in allen ursprünglichen Kommentarblasen zählen. Nun, wie macht man das? Manuelles Zählen wäre schwierig.

Könnte man irgendwie alle Kommentare in einer separaten Textdatei speichern, um sie zu zählen?

PS Ich habe gerade versucht, das DOC-Dokument als MHT-Datei zu speichern. Alle Kommentare werden übersichtlich am unteren Rand der Seite angezeigt. Ich kann sie alle auswählen und mit der rechten Maustaste auf "Kopieren" klicken. Wenn ich jedoch ein neues MS Word-Dokument öffne und auf "Einfügen" klicke, passiert nichts.

0

1 Antwort auf die Frage

1
jhilmer

Eine docx-Datei ist ein ZIP-Archiv mit einer Anzahl von xml-Dateien. Eine dieser Dateien ist 'comments.xml', die alle Kommentare enthält. Auf meinem Linux-System habe ich Folgendes ausgeführt, um den Text aller Kommentare zu extrahieren. Ich habe eine einfache test.docx-Datei mit einem Absatz erstellt, in dem ich einen Kommentar angefügt habe.

unzip test.docx  xmllint --xpath "//*[local-name()='t']/text()" word/comments.xml  

Welche den gesamten Text der Kommentare zurückgeben. Im Folgenden handelt es sich lediglich um eine einfache Anzahl von Zeichen / Wörtern.