Abrufen einer Liste von Wörtern aus einem GNU Aspell-Wörterbuch

1703
Velvet Ghost

Ich habe das aspell-Paket für die Unterstützung des Bengalisch-Wörterbuchs heruntergeladen. Aus dem Tarball konnte ich die Datei bn.wl isolieren. Dies ist einfach eine Liste mit etwa 100.000 Wörtern, eines in jeder Zeile.

Das Problem ist, dass die Kodierung anscheinend is13194-bn ist und jeder Texteditor, mit dem ich die Datei öffne, Müll anzeigt (ein Müllwort pro Zeile). Wahrscheinlich erwartet es utf8 oder so.

Wie kann ich diese Datei in eine lesbare Form konvertieren? Ich habe versucht, iconv zu verwenden, kann aber die Kodierung anscheinend nicht erkennen.

2
Haben Sie versucht, mit aspell die Wortliste bereitzustellen: `aspell -l bn dump master`? Paul vor 12 Jahren 0
Ich habe eine Fehlermeldung erhalten, als ich das auf meinem Ubuntu-Rechner ausprobierte, aber ich habe es auf einem Fedora-Rechner ausprobiert und es hat funktioniert! Danke vielmals! Kannst du das als Antwort posten, damit ich es akzeptieren kann? Velvet Ghost vor 12 Jahren 0

1 Antwort auf die Frage

1
Paul

Verwenden Sie aspell selbst, um die Wortliste in einem lesbaren Format bereitzustellen:

aspell -l bn dump master 

Die Option -l zielt auf ein bestimmtes Wörterbuch ab. Wenn es nicht vorhanden ist, wird das Standardwörterbuch ausgewählt.

Gibt es eine Möglichkeit, dasselbe mit aspell install zu tun, ohne die Sprache 'bn' installiert zu haben? Zum Beispiel, indem Sie aspell auf den Speicherort eines heruntergeladenen Aspell-Wörterbuchs (eine .cwl-Datei) zeigen. bliako vor 7 Jahren 1