Verwenden Sie aspell selbst, um die Wortliste in einem lesbaren Format bereitzustellen:
aspell -l bn dump master
Die Option -l zielt auf ein bestimmtes Wörterbuch ab. Wenn es nicht vorhanden ist, wird das Standardwörterbuch ausgewählt.
Ich habe das aspell-Paket für die Unterstützung des Bengalisch-Wörterbuchs heruntergeladen. Aus dem Tarball konnte ich die Datei bn.wl isolieren. Dies ist einfach eine Liste mit etwa 100.000 Wörtern, eines in jeder Zeile.
Das Problem ist, dass die Kodierung anscheinend is13194-bn ist und jeder Texteditor, mit dem ich die Datei öffne, Müll anzeigt (ein Müllwort pro Zeile). Wahrscheinlich erwartet es utf8 oder so.
Wie kann ich diese Datei in eine lesbare Form konvertieren? Ich habe versucht, iconv zu verwenden, kann aber die Kodierung anscheinend nicht erkennen.
Verwenden Sie aspell selbst, um die Wortliste in einem lesbaren Format bereitzustellen:
aspell -l bn dump master
Die Option -l zielt auf ein bestimmtes Wörterbuch ab. Wenn es nicht vorhanden ist, wird das Standardwörterbuch ausgewählt.