Eine docx-Datei ist ein ZIP-Archiv mit einer Anzahl von xml-Dateien. Eine dieser Dateien ist 'comments.xml', die alle Kommentare enthält. Auf meinem Linux-System habe ich Folgendes ausgeführt, um den Text aller Kommentare zu extrahieren. Ich habe eine einfache test.docx-Datei mit einem Absatz erstellt, in dem ich einen Kommentar angefügt habe.
unzip test.docx xmllint --xpath "//*[local-name()='t']/text()" word/comments.xml
Welche den gesamten Text der Kommentare zurückgeben. Im Folgenden handelt es sich lediglich um eine einfache Anzahl von Zeichen / Wörtern.