Das in der Frage beschriebene Problem tritt auf, wenn ein leeres / neues Dokument auf "ANSI" gesetzt ist und Unicode- Zeichen eingefügt wurden.
Bei Verwendung mit einem leeren / neuen Dokument gibt es keine automatische Erkennung, zumindest nicht in der Version von Notepad ++, auf der ich es getestet habe. "ANSI" ist der Standard in Notepad ++ für ein neues Dokument, sofern Sie nicht im Menü Einstellungen -> Voreinstellungen -> Registerkarte Neues Dokument / Öffnen Sie das Verzeichnis wählen .
Lösung
Die Lösung ist, die Kodierung vor dem Einfügen auf UTF-8 zu setzen, Menü Format -> Kodierung in UTF-8 :
Beispiel
Ich habe etwas Text in ein neues Notepad ++ - Dokument, Russisch (русский язык, russkiy yazyk), von Firefox kopiert, wobei die Wikipedia-Seite Russisch angezeigt wird .
Wenn die Kodierung nicht von "ANSI" geändert wird, ist dies das Ergebnis:
Wenn die Kodierung geändert wird, ist dies das Ergebnis:
Wie in der Abbildung unten zu sehen ist (der kyrillische Teil ist hervorgehoben), konvertiert Notepad ++ die Unicode-Zeichen tatsächlich in ASCII 63 (Hex 3F), Fragezeichen. Deshalb ist die Unicode - Zeichen sind verloren (in „ANSI“ Modus), wenn Sie den Text aus über die Zwischenablage zu kopieren (es ist nicht ein Schriftart Ausgabe - Informationen verloren).
Getestet am: Notepad ++ v5.4.5 (UNICODE).