Wie dekodiere ich eine Textdatei mit Symbolen wie \ uXXXX?

1132
LA_

Ich habe eine 10 MB-Datei mit \uXXXXZeichen. Wie kann ich das mit Sublime Text entschlüsseln?

Beispiel:
Wie dekodiere ich eine Textdatei mit Symbolen wie \ uXXXX?

1
Sie sollten auf die Datei verlinken oder eine kurze Form davon auf http://ge.tt setzen, da nicht klar ist, worüber Sie sprechen barlop vor 9 Jahren 0
@barlop, hier ist das Beispiel - http://pastebin.com/GT6Wtx6z LA_ vor 9 Jahren 0

1 Antwort auf die Frage

1
MattDMo

Es gibt verschiedene Dinge, die Sie ausprobieren können. In erster Linie müssen Sie eine Unicode-Schriftart verwenden, die die anzuzeigenden Zeichen unterstützt. Diese Seite auf unicode.org ist eine gute Ressource und Google ist wie immer sehr hilfreich. Wenn Sie nichts dagegen haben, eine Nicht-Monospace-Schriftart zu verwenden, wird Arial Unicode MS mit Windows geliefert und bietet eine gute Abdeckung. Ich glaube, dass die Monospace-Schrift von Consolas ebenfalls gut funktioniert.

Zweitens muss Ihr Betriebssystem für die Anzeige dieser Zeichen eingerichtet sein - die meisten modernen sind es, aber bei einigen Versionen und Setups von Windows können Probleme auftreten.

Vergewissern Sie sich in Sublime, dass Sie die Datei im richtigen Modus anzeigen. Versuchen Sie File -> Reopen with Encoding -> UTF-8oder ... -> UTF-16LE(oder BESie können beides versuchen).

Ohne den genauen Inhalt Ihrer Datei zu kennen, wie sie erstellt wurde, und weitere Details zu Ihrem System, ist dies das Beste, was ich tun kann. Viel Glück!


BEARBEITEN

Anhand der verknüpften Datei sieht es so aus, als sei dies die Ausgabe eines Python 2-Programms, da es sich bei den Daten scheinbar um Listen handelt, die Unicode-Zeichenfolgen enthalten (ich bin ein Python-Programmierer, wie es passiert). Ich habe ein paar der genannten Codepoints nachgeschlagen, und sie sind alle kyrillisch, also sollte jede moderne Schriftart sie behandeln. Das Problem ist, dass Sie ein Programm benötigen, um die Datei einzulesen und die einzelnen Bytes zu übersetzen. Bei Interesse ist die erste vollständige Zeichenfolge (von 'bis '):

Любимая акция вернулась! В ресторанах Евразия "" 3 ролла по цене 1 ""! С 9 по 12 сентября! Только эти 4 дня! Подробности на evrasia.spb.ru, 88005050145 и 008

Ohne die gesamte Datei kann ich das Ganze nicht für Sie analysieren, aber wenn Sie ein Python-Programmierer sind, sollten Sie wissen, was zu tun ist (ich würde Python 3 empfehlen, dessen Unicode-Unterstützung viel besser ist als 2.x ). Wenn nicht, suchen Sie die Person, die die Datei erstellt hat, und bitten Sie sie, die Bytes für Sie zu decodieren.

Danke für deine Antwort. Ich verwende die neueste Version von OSX und es gibt kein Problem mit der Anzeige von Unicode-Zeichen. Ich habe den Kommentaren meiner Frage ein Beispiel für die Datei hinzugefügt. LA_ vor 9 Jahren 0
@LA_ Danke für den Link, der das Problem gelöst hat. Siehe oben, was ich tun soll. MattDMo vor 9 Jahren 0
Vielen Dank. Ich bin die Person, die die Datei generiert hat (= sie wurde in Massen von Google App Engine heruntergeladen). Ich habe bereits den Weg gefunden, wie sie mit Python dekodiert werden kann. Ich bin trotzdem interessiert, ob ich dasselbe mit Sublime (oder mit integrierter Python-Konsole) tun kann. LA_ vor 9 Jahren 0
@LA_ Sublime Text 3 basiert auf Python 3.3, Sie müssen also nur jede Zeichenfolge in die Konsole einfügen und die korrekte Kodierung anzeigen. Dies ist jedoch für eine 10-MB-Datei nicht wirklich machbar, daher würde ein Plugin besser funktionieren. MattDMo vor 9 Jahren 0
kann ich nicht über die Konsole auf den Text der geöffneten Datei zugreifen? LA_ vor 9 Jahren 0
@LA_ ja kannst du. [Here] (http://www.sublimetext.com/docs/3/api_reference.html) ist die ST3-API für Ihre Kenntnisnahme. Der Grund, warum ich ein Plugin vorgeschlagen habe, ist, dass es bestimmte Dinge gibt, die Sie in der Konsole nicht ausführen können, wie zum Beispiel "for" / "if" / "while" -Schleifen, Funktionsdeklarationen usw. Linie. MattDMo vor 9 Jahren 0
Vielen Dank. Ich habe einfach kein Plugin gefunden, das eine Konvertierung benötigt. LA_ vor 9 Jahren 0
@LA_ Da dies ein Fall für das benutzerdefinierte Parsing der Eingabe ist, bezweifle ich, dass Sie dafür ein vorgefertigtes Plugin finden. Da Sie jedoch bereits eine Python-Lösung zum Übersetzen der Datei gefunden haben, sollte die Implementierung in Sublime trivial sein. MattDMo vor 9 Jahren 0