In meiner XML-Datei war ein ungültiges, lockiges Zitat.
Problem mit einem Dokument: Ungültiges Byte 3 der 3-Byte-UTF-8-Sequenz
Ich versuche ein XML-Dokument zu verwenden, stoße jedoch auf diesen Fehler:
Invalid byte 3 of 3-byte UTF-8 sequence
Mein Dokument sieht in etwa so aus, jedoch mit mehr Tags und Inhalten. Bitte konzentrieren Sie sich nicht auf das untenstehende Dokument. Ich verwende mehrere Dokumente mit diesem Format. Ich glaube, es ist ein Charakter in meinem Dokument, der ungültig ist, aber ich weiß nicht, wie er am besten gefunden werden kann, weil er so groß ist.
Irgendwelche Ideen oder Werkzeuge, die ich verwenden könnte? Vielen Dank.
Vielen Dank!
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd"> <map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/"> <title>Overview of the Commercial General Liability (CGL) Insurance Coverages </title><moreTagsHere><!-- more tags here... --></moreTagsHere> </map>
6 Antworten auf die Frage
- Beliebte
- Neu
- Mit Kommentaren
- Aktiv
Ich würde XMLStarlet versuchen :
[...] XMLStarlet ist eine Reihe von Befehlszeilen-Dienstprogrammen (Tools), mit denen XML-Dokumente und -Dateien mit einfachen Shell-Befehlen in ähnlicher Weise umgewandelt, abgefragt, validiert und bearbeitet werden können UNIX-Befehle für grep, sed, awk, diff, patch, join usw. [...]
[ mein Schwerpunkt ]
Ich habe den Verdacht, dass Sie ein Tool von Microsoft verwenden.
Meiner Erfahrung nach hat Expression Web Kopfzeileninformationen in Textdateien eingefügt, um sie als Format zu identifizieren - nichts anderes erkannte sie und zeigte sich als zufällige Zeichen. Dies war insbesondere ein Problem mit PHP, da es die Pleite einschlug.
Sie haben wahrscheinlich einen Editor verwendet, der der Datei eine Byte Order Mark (BOM) hinzufügt . Mit vielen / den meisten XML-Editoren / Website-Editoren können Sie das Dokument mit / ohne das bom speichern. Überprüfen Sie die Speicheroptionen in dem von Ihnen verwendeten Editor.
Sie müssen wahrscheinlich die Stückliste entfernen, um den Fehler zu vermeiden.
Wenn Ihr Editor diese Option nicht unterstützt, kann ich das ausgezeichnete Notepad ++ empfehlen
Vergessen Sie die Tatsache, dass es sich um XML handelt. Sie müssen den UTF-8 validieren. Vielleicht einfach in Firefox öffnen und nach dem Zeichen suchen? Ansonsten siehe UTF-8-Validierung bei Stack Overflow.
Wenn Sie Tomcat verwenden, müssen Sie wahrscheinlich die Kodierung einrichten. Ich verwende Tomcat als Dienst in Windows und in den Konfigurationsoptionen hat der folgende Befehl den Trick für mich ausgeführt:
Dfile.encoding=UTF-8
Ich hoffe es hilft.
Verwandte Probleme
-
8
Anzeigen von XML im Chrome-Browser
-
4
Wie kann ich unformatierte RSS-XML in einem Browser anzeigen?
-
5
Grep-Tool für XML
-
3
Wie speichert man ein XML-Dokument in Mac OS X?
-
2
Tool zum Ausfüllen von XML-Dateien auf XSD-Basis
-
3
Stellen Sie sicher, dass Emacs die Stückliste nicht aus XML-Dateien entfernen
-
2
Transformieren Sie eine DTD in ein XSD-Schema
-
1
Excel Pivot-Tabelle aus XML lesen
-
5
Vorteile des DOCX-Formats gegenüber DOC
-
5
Wie kann ich SAS-Datendateien in etwas einfaches wie CSV-Daten konvertieren?