Vorteile des DOCX-Formats gegenüber DOC

6919
Narek

Heute habe ich versehentlich herausgefunden, dass .docx der gleiche .zip ist (oder es gibt keinen großen Unterschied zwischen ihnen). Wenn Sie die .docx-Datei in die ZIP-Datei ändern und WinRAR öffnen, sehen Sie eine Reihe von XML-Dateien in den Ordnern. In dieser XML-Datei werden Text, Schriftarten, Besitzer, zuletzt geändert usw. gespeichert. In einem Wort werden alle Informationen als XML-Daten gespeichert.

Das Gleiche gilt jedoch nicht für .doc-Erweiterungsdateien. Es ist unmöglich, sie als .zip op als .rar zu öffnen.

Frage: Was ist der Vorteil, wenn .docx-Daten in XML gespeichert werden, weil Microsoft die Art der Datenspeicherung geändert hat? In der Tat möchte ich wissen, nicht den Vorteil des XML-Formats, sondern warum Microsoft mehrere XML-Dateien zum Speichern der DOCX-Daten verwendet. Das bedeutet, dass .docx kein neues Format im Stammverzeichnis ist.

9
Innerhalb 1 Minute .. 5 fast dieselben Antworten. Die Kraft von SO MRG vor 14 Jahren 0
Daten im XML-Format bedeuten nicht, dass es sich nicht um ein neues Format handelt. Sie können dieses XML nicht in OpenOffice eingeben und es korrekt rendern. Sie müssen klar definieren, was XML-Struktur sein soll, welche Attribute, welche Elemente usw. vor 14 Jahren 1
Ändern Sie den Titel in etwas informativer. Carl Bergquist vor 14 Jahren 1
Natürlich ist es ein neues Format. Komm jetzt. vor 14 Jahren 2
Dear Janis Veinbergs and Kyle Rozendo I have worked with XML and XSD a lot of times and I know how it works!!! Be attentive I said "in the root". You can't agree that it is the XML format just used, not a new format!!!! Narek vor 14 Jahren 0
Wunderbare Frage - genau das, woran ich interessiert war! Tal Galili vor 13 Jahren 0

5 Antworten auf die Frage

12
Mehrdad Afshari

Eine .docxDatei kann eingebettete Ressourcen wie Bilddateien speichern, nicht nur XML-Dateien. Anstatt Dinge in base64 oder etwas zu codieren und in einer XML-Datei zu speichern oder ein anderes binäres Serialisierungsformat zu erstellen, entschieden sie sich für das Standard-ZIP-Format.

Außerdem ist XML ein sehr ausführliches Dateiformat, das viele redundante Muster enthält. Sie können eine hohe Komprimierungsrate für XML-Dateien erhalten.

Übrigens verstehe ich den "Trick uns" Teil nicht wirklich. Ist es besser, ein neues kryptisches Dateiformat von Grund auf zu erfinden oder ein bekanntes Standardformat zu verwenden?

Der Hauptvorteil, den ich sehe, ist, dass es Open APIs gibt, um diese Dateien tatsächlich zu erstellen. Das Erstellen von DOCX-Dateien ist also völlig neu, ohne dass proprietäre SDKs aufgewendet werden müssen. Das Microsoft SDK enthält sogar einen Dokumentreflektor, der C # -Code generiert, um ein vorgefertigtes Dokument von Grund auf zu erstellen. Will Eddins vor 14 Jahren 0
@ Guard: Ja. Meine Antwort bezieht sich auf die ursprüngliche Version der Frage. Die Frage hat sich seitdem erheblich verändert;) Der Originaltitel lautete "Microsoft betrügt?" Mehrdad Afshari vor 14 Jahren 0
XML macht an sich kein Format "bekannt", da .docx eines der besten Beispiele ist. artistoex vor 12 Jahren 0
5
Henning

Der Wikipedia-Artikel bringt es auf den Punkt:

"Microsoft geriet zunehmend unter Druck, ein offenes Dateiformat einzuführen, insbesondere verabschiedeten mehrere Nationen Regeln, nach denen offizielle Dokumente in einem offenen Format vorliegen sollten."

Edit: Und das Einpacken macht sehr viel Sinn, da das XML sehr ausführlich ist und natürlich sehr gut komprimiert wird.

"Öffnen" bedeutet nicht "kann entpackt werden". Greg Hewgill vor 14 Jahren 3
Das Zippen hat neben der Kompression noch weitere Vorteile. Es dient auch als Container für mehrere Dateien. Joey vor 14 Jahren 3
3
Greg

Die Verwendung einer umbenannten ZIP-Datei ist üblich - zum Beispiel sind .pak-Dateien von Quake III wirklich ZIP-Dateien. Es macht keinen Sinn, ein eigenes komprimiertes Dateiformat zu erfinden, wenn es bereits einwandfreie Formate gibt.

Weitere Beispiele für die Verwendung von ZIP-Archiven: Java `.jar`, Winamp` .wsz` / `.wal` (Skins), Firefox` .xpi` (XPInstaller - Themes, Addons). (`tar`-Archive sind ebenfalls beliebt.) grawity vor 14 Jahren 1
1
Joey

Es ist nicht nur Office Open XML, das gezipptes XML verwendet. Open Office's OpenDocument macht das gleiche im Hintergrund.

Es gibt einige Vorteile, die auf der Wikipedia-Seite der Open Packaging Conventions aufgeführt sind :

Indirektion

Nehmen Sie das Beispiel eines Katalogs, bei dem ein Logo 1.000 Mal wiederholt wird. Wenn wir mit einem Indirektionsmechanismus das Logo ändern möchten, müssen wir nur einen Eintrag in einer Datei ändern. Es ist keine Suche erforderlich, da wir wissen, wo wir suchen müssen. Dies erhöht die Wartbarkeit erheblich. Wenn Sie beispielsweise das Layout der ZIP-Verzeichnisse ändern möchten, in denen Ihre Dateien gespeichert sind, wird dies zu einer unbedeutenden Angelegenheit, da Sie nicht jedes Element kennen müssen, das auf eine Datei zeigen kann. Sie befinden sich alle an einer Stelle.

Chunking

Es wird empfohlen, Dokumente in kleine Stücke aufzuteilen. Dies ist besser, um die Auswirkungen von Dateibeschädigungen zu reduzieren. Und besser für den Datenzugriff: Zum Beispiel alle Stilinformationen in einem XML-Teil, jedes separate Arbeitsblatt oder eine Tabelle in ihren eigenen verschiedenen Teilen. Dies ermöglicht einen schnelleren Zugriff und weniger Objekterstellung für Clients. Außerdem können mehrere Prozesse mit demselben Dokument arbeiten.

Chunking kommt auch Programmierern zugute. Das Ersetzen eines Stylesheets durch ein anderes wird zu einer ZIP-Dateioperation und nicht zu einer XML-Operation. Und es reduziert die Menge an Dingen, die ein Programmierer verstehen muss, weil er sich an die Brocken heranwagen kann, vorausgesetzt, dass alle Informationen zu einem Thema in diesem Brocken sind: Ihnen bleibt die mentale Mühe erspart, eine große Datei mit vielen Dateien durchsuchen zu müssen fremde Elemente.

Relative Indirektion

In den Open Packaging-Konventionen hat jede Datei, die eine Referenz enthält, eine eigene _rels-Datei mit den Umleitungslisten. Dies macht es in manchen Fällen einfacher, einige Informationen mit all ihren zugehörigen Ressourcen auszuschneiden und einzufügen, und bietet einen Namensbereich, um die Möglichkeit eines Namensüberschneidens zwischen Dateien usw. zu beseitigen.

0
Joe Internet

Der größte Vorteil ist, dass Sie zu Ihren Daten gelangen können, indem Sie die Datei entpacken und den Text aus den XML-Dateien kopieren. Dies kann mit einem ZIP-Dienstprogramm und einem Texteditor durchgeführt werden, auch wenn Sie keine Kopie von Word 2007 haben.

Dies macht das Format offener als die älteren Binärformate.