Private UTF-8-Sequenzen

338
Tom Melly

Ich habe ein paar 3-Byte-UTF-8-Oktalsequenzen in den privaten Bereichen, und ich kann keine geeigneten Ressourcen finden, die mir helfen, das zu entschlüsseln, was sie darstellen sollen.

Bisher habe ich in Perl folgenden Code hinzugefügt: $ line = ~ s / \ 342 \ 211 \ 244 /> = / g; # utf> = an ascii> =

Aber ich bin ein bisschen verblüfft über Folgendes:

356 201 211 -? 356 205 222 - & agr; 356 201 212 -? 356 200 210 - & le;

Vorschläge für eine Ressource, die möglicherweise dazu beiträgt, diese zu entschlüsseln, oder eine Vorgehensweise, die Sie ergreifen können? Ich nahm an, dass sie aus Word stammen könnten, aber Word weiß nicht, was er daraus machen soll ...

0
* ["In Unicode ist ein Bereich für den privaten Gebrauch (PUA) ein Bereich von Codepunkten, dem definitionsgemäß vom Unicode-Konsortium keine Zeichen zugewiesen werden. (...) Die Codepunkte in diesen Bereichen können nicht als standardisiert betrachtet werden Zeichen in Unicode selbst. "] (https://en.wikipedia.org/wiki/Private_Use_Areas) *. Sie müssen also grundsätzlich raten oder fragen, wer Ihnen diese gegeben hat. gronostaj vor 6 Jahren 0

0 Antworten auf die Frage