Der Unicode-Zeichensatz enthält das Konzept der Kombination von Zeichen :
kombinierende Zeichen sind Zeichen, die andere Zeichen ändern sollen
Wenn Sie den obigen Text kopieren und mit Notepad ++ anzeigen, erhalten Sie:
Die Zeichenfolge enthält nicht weniger als 38 Zeichen, wobei die meisten Zeichen kombiniert werden.
Zum Beispiel kann man das Zeichen KOMBINIEREN, das wie folgt aussieht:
Diese kombinierten Zeichen, die hauptsächlich für die Verwendung in komplexen asiatischen Sprachen vorgesehen sind, können auch kreativ als Dekoration für lateinische Zeichen verwendet werden. Dies wurde auch hier vorgenommen.
Ab Unicode 6.2, Kapitel 2 :
Alle kombinierenden Zeichen können auf jedes Basiszeichen angewendet werden und können grundsätzlich mit jedem Skript verwendet werden. Wie bei anderen Zeichen kennzeichnet die Zuordnung eines kombinierenden Zeichens zu einem Block oder zu einem anderen Block nur seine primäre Verwendung. Es ist nicht beabsichtigt, den Zeichenbereich festzulegen, auf den es angewendet werden kann. Im Unicode-Standard sind alle Folgen von Zeichencodes zulässig.
Dies schafft keine Verpflichtung für Implementierungen, alle möglichen Kombinationen gleichermaßen zu unterstützen. Obwohl das Anbringen eines arabischen Anmerkungszeichens an einem Han-Zeichen oder einem Devanagari-Konsonanten erlaubt ist, ist es unwahrscheinlich, dass es beim Rendern gut unterstützt wird oder viel Sinn ergibt.