TXT-Dateien: Wie wechselt man von komischen Zeichen zu normalen Zeichen?

591
Alex

Also, ich habe auf einem Flash-Laufwerk eine Textdatei, die in Kyrillisch (meine eigene Arbeit, eigener Stift) erstellt wurde, einige Jahre alt. Jetzt musste ich es öffnen, nur um diese Art von Chaos zu sehen .

Ich frage mich, warum dies geschieht und wie ich es wieder herstellen kann. Ich habe versucht, es unter Unicode- und UTF-8-Kodierung abzuspeichern, sogar im MS-DOS-Format (eine Option von Wordpad), aber es macht überhaupt keinen Unterschied.

0
Ihr Dokument wurde anscheinend in der KOI-8-Kodierung gespeichert. Sie müssen einen Weg finden, um diese Kodierung in Unicode zu übersetzen. Jeff Zeitlin vor 5 Jahren 0
Möglicherweise finden Sie https://2cyr.com/decode/ als nützlich. Jeff Zeitlin vor 5 Jahren 1
Ich hoffe, Sie haben eine Kopie der Originaldatei, denn das Speichern der "unordentlichen" Datei mit einer anderen Kodierung macht das Problem noch schlimmer. Johan Myréen vor 5 Jahren 3
Öffnen Sie es in MS Word Rus mit automatisch erkannter Codierung oder manueller Codierungsauswahl (KOI-8r, CP866 usw. - versuchen Sie es bis zur korrekten Vorschau), und speichern Sie die Codierung erneut, die Sie benötigen (nicht speichern!). Oder verwenden Sie einen Online-Recoder, um die ursprüngliche Codierung des Textes zu bestimmen. Akina vor 5 Jahren 0
@Johan Myréen Natürlich habe ich das herausgefunden und als neue Dateien gespeichert Alex vor 5 Jahren 0
@Akina "Öffnen Sie es in MS Word Rus mit manueller Codierungsauswahl" Danke, das hat funktioniert. Alex vor 5 Jahren 0
@Akina "In Codierung erneut speichern, die Sie benötigen (nicht zu viel speichern!)" Obwohl ich für andere mit dem gleichen (ziemlich häufigen) Problem, das möglicherweise auf diesen Thread stößt, erwähnen muss, funktioniert dies nicht, wenn Sie es tun -Speichern als eine andere TXT-Datei, obwohl mit der richtigen Kodierung - es war wieder so ein Durcheinander von Zeichen. Nur das Speichern als Word- oder RTF-Datei hilft. Alex vor 5 Jahren 0
@Jeff Zeitlin Danke auch, gut, dass es so etwas gibt, obwohl ich es diesmal nicht brauchte, kann es in Zukunft hilfreich sein :) Alex vor 5 Jahren 0

2 Antworten auf die Frage

1
Austin Hemmelgarn

Was Sie sehen, wird als Mojibake bezeichnet . Kurz gesagt, die Anwendung, mit der Sie die Datei öffnen, verwendet die falsche Kodierung, um zu versuchen, die Datei zu lesen. Das Standard-Update besteht darin, ein Transcodierungs-Tool zu verwenden, entweder online oder offline (obwohl ich keine freien Windows-Tools kenne, die offline arbeiten) oder das Dokument in einer Anwendung öffnen, mit der Sie die Codierung festlegen und durch das gewünschte Dokument speichern können Codierung.

Wenn Sie die Datei speichern können, ohne die Codierung zu ändern, können Sie die Erweiterung ändern .eml, sie wie eine E-Mail-Nachricht formatieren, sicherstellen, dass der Content-TypeHeader die richtige Codierung angibt, und die resultierende Datei in einer guten E-Mail öffnen Client (fast alles außer Outlook oder Windows Mail) und kopieren Sie den Text von dort in einen Texteditor und speichern Sie ihn.

Um dies zu vermeiden, ist es allgemein üblich, Dateien als UTF-8 oder UTF-16 zu speichern (UTF-8 wird normalerweise bevorzugt, da sie von den meisten anderen Plattformen als Windows besser unterstützt wird als UTF-16).

Insbesondere scheint Ihre Datei tatsächlich mit KOI-8 codiert zu sein (bestimmt aufgrund der Aussage, dass der Text kyrillisch ist und die Verteilung der tatsächlichen Zeichen offensichtlich ist), wobei die Anwendung ihn offenbar als ISO-8859-1 oder Windows-Codepage interpretiert 1252 (wird einfach anhand der Anzeige bestimmt, zuzüglich der Tatsache, dass es sich bei vielen Geräten um Standardfallback-Kodierungen handelt).

Viele Texteditoren (z. B. Notepad2) fungieren als Transkodierungswerkzeuge: Sie können sie zwingen, eine Datei mit der von Ihnen angegebenen Kodierung zu öffnen, und sie dann als UTF-x speichern. grawity vor 5 Jahren 0
@ grawity Notepad und Wordpad unterstützen dies jedoch nicht. Wenn Sie also keinen Texteditor eines Drittanbieters unter Windows haben, haben Sie kein Glück. Austin Hemmelgarn vor 5 Jahren 0
0
RProgram

Sie können den Editor CudaText (oder SynWrite) kostenlos testen.

  • Öffnen Sie diese TXT-Datei
  • Klicken Sie auf das Statusfeld mit dem Namen der Codierung (z. B. ANSI) und "Reload as".
  • Kodierung finden, die OK-Text macht
  • Wenn die Kodierung gefunden wurde, klicken Sie auf das Statusfeld mit dem Kodierungsnamen "Konvertieren in".
  • Verwenden Sie UTF8
  • Datei mit UTF8 speichern