Das file
Tool verfügt über eine Reihe von Heuristiken zum Erraten von Dateitypen, einschließlich einer, die "englischen Text" meldet. Ich weiß nicht, ob es über andere menschliche Sprachen Bescheid weiß, aber es könnte definitiv verbessert werden, um zwischen ihnen zu raten.
Werkzeug zur Erkennung von Textsprache?
2118
Flethuseo
Gibt es ein Werkzeug, das die Sprache des Textes mehrerer Absätze ermitteln kann?
2 Antworten auf die Frage
1
dmckee
1
Mortimer
Dafür gibt es viele Tools. Das erste, das mir einfällt, ist das von Google: http://code.google.com/apis/ajax/playground/#language_detect
- In Java gibt es http://textcat.sourceforge.net/
- In Ruby https://github.com/peterc/whatlanguage
- In Perl http://search.cpan.org/~ambs/Lingua-Identify-0.29/lib/Lingua/Identify.pm usw.
Ich hoffe es hilft
Das language_detect-Tool von Google scheint vielversprechend zu sein, ich muss dies für mehr als einen Text tun. Ich sehe dort Code, weiß aber nicht, ob ich ihn auf meinem Rechner ausführen kann.
Flethuseo vor 13 Jahren
0
Die Google-API hat wahrscheinlich Grenzen für die Anzahl der Abfragen, die Sie senden können. Daher müssen Sie möglicherweise eine der anderen Bibliotheken verwenden.
Mortimer vor 13 Jahren
0
Verwandte Probleme
-
9
Warum ändert Windows die Eingabesprache zufällig?
-
2
Kubuntu KDE-Sprachmischung
-
1
Vista Spracherkennung in mehreren Sprachen
-
2
Wechseln zwischen Tastaturen in Mac - Tastenkombination?
-
3
Kann ich die "Sprachleiste" von der Befehlszeile aus schließen?
-
1
Wie kann ich unter Windows 7 den Benutzerkonten Sprachen (Deutsch / Englisch) zuweisen?
-
2
Windows 7 + lang-Pack gegenüber nationaler Version?
-
3
Ändern Sie in Vista die Systemsprache von Russisch in Englisch
-
5
Microsoft Outlook bleibt beim Wechseln der Eingabesprache hängen
-
4
Warum wechselt Alt + Shift nicht in Microsoft Word?