Unicode- und ASCII-Abwärtskompatibilität

706
Stribor

Wenn die ersten 127 Zeichen identisch sind, verwenden wir warum immer noch ASCII und es besteht ein Abwärtskompatibilitätsproblem, wenn Unicode anstelle von ASCII verwendet wird

-1
Die akzeptierte Antwort für [ANSI an UTF-8 in Notepad ++] (http://superuser.com/questions/762473/ansi-to-utf-8-in-notepad/762475#762475) wäre hilfreich. Thomas Dickey vor 8 Jahren 1

1 Antwort auf die Frage

-2
DrMoishe Pippik

ASCII, später ANSI genannt, hat eine 1: 1-Beziehung zwischen Byte und Zeichen. Multibyte-Zeichensysteme, einschließlich Unicode, haben den Vorteil, dass zusätzliche Zeichen auf Kosten zusätzlicher Speicher angezeigt werden . Darüber hinaus gibt es viele Implementierungen von Multibyte-Zeichensystemen. In einigen Fällen wird die Bytereihenfolge von der Stückliste angegeben . Die Interpretation von UTF-8, UTF-16 und UTF-32 ergibt unterschiedliche Werte für dieselbe Bytefolge. Darüber hinaus gibt es unterschiedliche ISO-Standards für unterschiedliche Alphabete, wie beispielsweise die skandinavische Implementierung mit A-Minuskel-O, wie bei "Åland Islands".

So hat ANSI für einfache Datenbankzwecke oder für die Verwendung mit sehr begrenztem Speicher beispielsweise Platzvorteile und unterliegt keiner Fehlinterpretation. Wenn jedoch der vollständige Zeichensatz vieler Alphabete angezeigt werden muss, sind Multibyte-Sätze nützlich.

Ich verstehe, dass es unterschiedliche Speicher in ASCII und Unicode gibt, aber das Zeichen "a" haben wird Stribor vor 8 Jahren 0
Gleiche Kodierung nur unterschiedliche Auffüllung? Ist das richtig? Stribor vor 8 Jahren 0
A in ANSI ist Byte (65), dec oder * 41 *, hex. A in UTF-8 ist * 0041 *, hex oder * 4100 * mit umgekehrter Stückliste. Es gibt nicht nur eine Auffüllung, es kann auch eine linke * oder * rechte Auffüllung sein. DrMoishe Pippik vor 8 Jahren 0
ISO / IEC 8859-x sind * Einzelbyte * Zeichensätze. Ich habe keine sachkundige Quelle gesehen, die auf US-ASCII als "ANSI" verweist. Thomas Dickey vor 8 Jahren 1
Sorry ANSI war viel zu falsch. Sorry, mein Tippfehler :( Stribor vor 8 Jahren 0
@ThomasDickey In der Windows-Welt wurde "ANSI" verwendet, um die standardmäßige 8-Bit-GUI-Codepage zu bezeichnen. Ob angemessen oder (eher) nicht, aber es wird immer noch häufig verwendet. Siehe zum Beispiel https://msdn.microsoft.com/de-de/library/windows/desktop/dd317752.aspx `Windows-Codepages, im Allgemeinen als" ANSI-Codepages "bezeichnet. dxiv vor 8 Jahren 0
In richtigen Kontexten (außer Windows) bedeutet ANSI die * organisation * http://www.ansi.org, die Standards für viele tausend andere Dinge als ASCII entwickelt oder angenommen hat, von Magnetbändern über Verschlüsselung über fotografische Filme bis hin zu Werkzeugmaschinen Augenschutz und Arbeitsstiefel. dave_thompson_085 vor 8 Jahren 2