Private UTF-8-Sequenzen
338
Tom Melly
Ich habe ein paar 3-Byte-UTF-8-Oktalsequenzen in den privaten Bereichen, und ich kann keine geeigneten Ressourcen finden, die mir helfen, das zu entschlüsseln, was sie darstellen sollen.
Bisher habe ich in Perl folgenden Code hinzugefügt: $ line = ~ s / \ 342 \ 211 \ 244 /> = / g; # utf> = an ascii> =
Aber ich bin ein bisschen verblüfft über Folgendes:
356 201 211 -? 356 205 222 - & agr; 356 201 212 -? 356 200 210 - & le;
Vorschläge für eine Ressource, die möglicherweise dazu beiträgt, diese zu entschlüsseln, oder eine Vorgehensweise, die Sie ergreifen können? Ich nahm an, dass sie aus Word stammen könnten, aber Word weiß nicht, was er daraus machen soll ...
* ["In Unicode ist ein Bereich für den privaten Gebrauch (PUA) ein Bereich von Codepunkten, dem definitionsgemäß vom Unicode-Konsortium keine Zeichen zugewiesen werden. (...) Die Codepunkte in diesen Bereichen können nicht als standardisiert betrachtet werden Zeichen in Unicode selbst. "] (https://en.wikipedia.org/wiki/Private_Use_Areas) *. Sie müssen also grundsätzlich raten oder fragen, wer Ihnen diese gegeben hat.
gronostaj vor 6 Jahren
0
0 Antworten auf die Frage
Verwandte Probleme
-
6
Unicode, Unicode Big Endian oder UTF-8? Was ist der Unterschied? Welches Format ist besser?
-
1
Wie kann ich mit * nix-Befehlszeilen-Tools mehrere Dateien in UTF-8-Codierung konvertieren?
-
2
Wie benutze ich UTF-8 in vim unter Mac OS X?
-
2
Wie verbinde ich von einem utf-8-Client über ssh einen latin1-Server?
-
3
App zum Konvertieren von ANSI in UTF8 unter Windows
-
6
Dreamweaver wird auf Western-Kodierung zurückgesetzt, nachdem es in UTF8 geändert wurde
-
3
Batch-Änderungscodierungs-ASCII-Dateien von utf-8 zu iso-8859-1
-
2
Datei kann nicht in UTF-8 konvertiert werden
-
3
Firefox verstümmelter Text
-
1
Kostenloser ANSI-zu-UTF8-Konverter für mehrere Dateien