Sie können einen beliebigen Zeichensatz und eine beliebige Kodierung verwenden, um eine Datei zu erstellen und anzuzeigen.
Sie müssen lediglich sicherstellen, dass Sie beim Anzeigen den gleichen Satz und die gleiche Codierung verwenden, mit der die Datei geschrieben wurde.
Die meisten Zeichensätze haben tatsächlich eine große Überlappung. Zum Beispiel haben die meisten Zeichensätze (außer EBCDIC und andere) den ASCII-Zeichensatz an denselben Positionen (dh mit denselben Codepunkten) wie ASCII. Daher können Sie eine Datei im Unicode-Zeichensatz mit UTF-8-Codierung schreiben. Solange die Datei nur Zeichen enthält, die in ASCII-Format vorliegen, können Sie diese Datei mit einer Windows-Latin-1-Codierung anzeigen.
Hinweis: Microsoft ist sehr schlampig mit Begriffen wie "ANSI" und "Unicode".
Aktualisieren:
Erstens sollten Sie auf Jukkas Antwort achten, da Jukka ein Experte für dieses Thema ist .
Zu Ihrem Á siehe diesen Auszug hier
Dec Hex ASC PC 437 850 Win Lat1 Uni 192 00C0 └ └ └ À À À 193 00C1 ┴ ┴ ┴ Á Á Á 194 00C2 ┬ ┬ ┬ Â Â Â 195 00C3 ├ ├ ├ Ã Ã Ã 196 00C4 ─ ─ ─ Ä Ä Ä 197 00C5 ┼ ┼ ┼ Å Å Å
Beachten Sie, dass Á sich in Windows Latin-1, in ISO 8859-1 Latin 1 und in Unicode / ISO 10646 am Codepunkt 194 (0xC1) befindet. Wenn Sie Á in Windows Latin-1 schreiben, können Sie es als ISO 8859-1 anzeigen.
Sie hätten Probleme, wenn Sie versuchen würden, es als Unicode zu lesen, da Unicode-Kodierungen mehrere Bytes verwenden, um dieses Zeichen darzustellen.
# echo $LANG en_US.UTF-8 # cat t TEST Á # hexdump -C t 00000000 54 45 53 54 20 c3 81 0a |TEST ...| 00000008
Beachten Sie, dass Á (Unicode-Codepunkt 00C1) in UTF-8 als c3 81 codiert ist