Wie kann ich Unicode-Text in Notepad ++ bearbeiten?

127171
Robinicks

Manchmal bearbeite ich englischen Text, der Unicode-Zeichen enthält. Aus irgendeinem Grund konvertiert Notepad ++ auf meinem PC Unicode-Zeichen in ???, wodurch der Text beschädigt wird und all diese Daten verloren gehen. Ich suche nach einer Möglichkeit, solchen Text unter Beibehaltung der Unicode-Zeichen zu bearbeiten. Ich benutze Consolas als meine Schrift. Wenn die Schriftart nicht alle diese Zeichen enthält, warum sollte ich die Daten verlieren, wenn ich den Text aus Notepad ++ kopiere (über die Zwischenablage von Windows)?

25
Wenn es sich um Fragezeichen in Feldern handelt, handelt es sich tatsächlich um die Glyphe der Schriftart für fehlende Glyphen, und Ihre Daten gehen * nicht * verloren. Joey vor 15 Jahren 0
Nein, es ist nicht in Boxen, sondern die Ebene '?' Charakter. Bestätigt. Robinicks vor 14 Jahren 0
Möglicherweise müssen Sie die Schriftart ändern. Siehe http://superuser.com/questions/16831/how-can-the-font-size-be-changed-in-notepad/123826#123826 RamyenHead vor 14 Jahren 1
Könnten Sie ein Plugin verwenden, das Unicode nicht unterstützt? Ivo Flipse vor 15 Jahren 0

6 Antworten auf die Frage

14
DisgruntledGoat

Wenn die Datei tatsächlich in Unicode codiert ist, sollte Notepad ++ sie automatisch erkennen. Die Consolas-Schrift funktioniert gut für mich. Sie können eine dieser beiden Menüoptionen ausprobieren:

  • Kodierung -> Kodierung in UTF-8
  • Kodierung -> In UTF-8 konvertieren

Ich bin mir ziemlich sicher, dass der erste tun wird, was Sie wollen.

Ich habe kein Format-Menü. Val vor 10 Jahren 0
Für die Nachwelt benötigen Sie das Menü Kodierung, nicht Format Ken Bellows vor 8 Jahren 1
14
Peter Mortensen

Das in der Frage beschriebene Problem tritt auf, wenn ein leeres / neues Dokument auf "ANSI" gesetzt ist und Unicode- Zeichen eingefügt wurden.

Bei Verwendung mit einem leeren / neuen Dokument gibt es keine automatische Erkennung, zumindest nicht in der Version von Notepad ++, auf der ich es getestet habe. "ANSI" ist der Standard in Notepad ++ für ein neues Dokument, sofern Sie nicht im Menü Einstellungen -> Voreinstellungen -> Registerkarte Neues Dokument / Öffnen Sie das Verzeichnis wählen .

Lösung

Die Lösung ist, die Kodierung vor dem Einfügen auf UTF-8 zu setzen, Menü Format -> Kodierung in UTF-8 :

Menu command "menu Format/Encode in UTF-8" about to be executed

Beispiel

Ich habe etwas Text in ein neues Notepad ++ - Dokument, Russisch (русский язык, russkiy yazyk), von Firefox kopiert, wobei die Wikipedia-Seite Russisch angezeigt wird .

Wenn die Kodierung nicht von "ANSI" geändert wird, ist dies das Ergebnis:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document without changing the encoding from the default "ANSI".

Wenn die Kodierung geändert wird, ist dies das Ergebnis:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document after changing the encoding from the default "ANSI" to "UTF-8".

Wie in der Abbildung unten zu sehen ist (der kyrillische Teil ist hervorgehoben), konvertiert Notepad ++ die Unicode-Zeichen tatsächlich in ASCII 63 (Hex 3F), Fragezeichen. Deshalb ist die Unicode - Zeichen sind verloren (in „ANSI“ Modus), wenn Sie den Text aus über die Zwischenablage zu kopieren (es ist nicht ein Schriftart Ausgabe - Informationen verloren).

Screenshot of a hex view of said document

Getestet am: Notepad ++ v5.4.5 (UNICODE).

5
Josh Hunt

Es gibt gute und schlechte Nachrichten.

Gute Nachrichten: Notepad ++ unterstützt Unicode (zumindest von dem, was ich finden kann).

Schlechte Nachrichten: Anscheinend wird Unicode nur unter Windows XP unterstützt.

Ich habe eigentlich keinen Windows-Rechner vor mir. Soweit ich mich erinnere, gibt es irgendwo ein Encoding-Menü unter dem Format-Menü. Die Kodierung für Unicode ist in der Regel UTF-8.

Hier ist ein 'hübsches' Bild der Unicode-Unterstützung in Notepad ++.

enter image description here

3
Peter Mortensen

Unicode funktioniert perfekt unter Windows 7. Das einzige Problem, das aufkommt, ist, dass Sie die geänderten Zeichen erneut eingeben müssen. Es ist mir passiert. Ich schreibe mit skandinavischen Buchstaben also ä -> E4, ö -> F6. Es ist ein Schmerz im Hintern, sie alle zu ersetzen, aber es lohnt sich.

Wenn Sie eine Seite aus ANSI -> UTF-8 kodieren, treten Zeichenprobleme auf.

Ich würde vorschlagen, dass Sie zuerst eine neue Seite in UTF-8 erstellen und dann Ihre Informationen kopieren / einfügen. Es wird dann kein Ärger geben.

1
rapy rapy

Das ist für mich gearbeitet:

Ich habe die Schriftart auf meinem PC in Courier New- Style-Konfigurator geändert (Windows 7 mit englischem / US-Zeichensatz und Rumänisch für Nicht-Unicode-Satz). Es arbeitet mit Courier New- und Tahoma-Schriftarten + UTF-8-Kodierung.

0
Siavash

EncodingWählen Sie im oberen Menü die Option Wählen Sie dann Encode in UTF-8oder Encode in UTF-8 Without BOMSie können den Text in Unicode-Kodierung bearbeiten.