Nicht-ASCII-Zeichen korrekt in hunspell anzeigen

2075
Ludwig Weinzierl

Ich möchte hunspelldie Befehlszeile verwenden, um einige Textdateien auf Rechtschreibprüfung zu überprüfen. Die Dateien sind utf-8- codiert und enthalten einige Umlaute und andere merkwürdige Zeichen.

Einige Wörter tauchen so auf

verlä ~ _lich

an Stelle von

verläßlich

Ich habe hunspell angewiesen, die Dateien als utf-8 mit zu lesen -i utf-8. Ich habe versucht, die Kodierung in gnome-terminal umzuschalten. Ich habe es in xtermund versucht xterm -u8. Kein Erfolg .

Es handelt sich nicht um ein Schriftproblem, denn wenn ich die seltsamen Zeichen in das Terminal eingebe, werden sie gut angezeigt.

Wie bekomme ich die seltsamen Charaktere?

1

1 Antwort auf die Frage

1
RJFalconer

Welchen Befehl verwenden Sie zum Ausführen von hunspell?

hunspell −d de_DE -i UTF-8 filename 

Wenn kein Glück da ist

SET UTF-8 

... sollte in Ihre Affixdatei gehen. In Ihrem Fall ist Ihre Affixdatei wahrscheinlich de_DE.aff.

Der Standardwert, wenn none angegeben ist, ist

/usr/share/myspell/default.aff 

Hoffe das hilft!

Meine Affix-Datei enthält SET ISO8859-1. Wenn ich sie in UTF-8 umwandle, gibt hunspell viele Fehler aus, bevor die Rechtschreibprüfung beginnt. Unterschiedliche Meldungen, aber die meisten davon sind: Diese UTF-8-Kodierung kann nicht in UTF-16 konvertiert werden. Ich denke, das liegt daran, dass die Affix-Datei einfach nicht UTF-8 ist. Ludwig Weinzierl vor 15 Jahren 0
Ah, einige Verwirrung hier, denke ich. In Ihrer ursprünglichen Frage haben Sie "Die Dateien sind utf-8-codiert". Wenn ISO8859-1 die wenigsten Fehler aufweist, ist es wahrscheinlich das, was Sie wollen. Es sollte auf jeden Fall Deutsch unterstützen. Können Sie den Inhalt Ihrer Affix-Datei zusammen mit dem Befehl, den Sie zum Ausführen von hunspell verwenden, in der ursprünglichen Frage posten? Vielen Dank! RJFalconer vor 15 Jahren 0