Suche nach Sprach-zu-Text-Werkzeug (Konvertieren von .wav in Text)

31366
David

Ich kann WAV-Dateien mit Voicemails per E-Mail erhalten, aber manchmal sitze ich in einer Besprechung und muss den Inhalt einer Nachricht kennen, ohne sie laut zu spielen.

Gibt es gute (und vorzugsweise kostenlose) Werkzeuge zum Konvertieren von .wav-Dateien in Text? Ich weiß, dass Google Voice über diese Funktion verfügt, aber ich kann nicht feststellen, ob es von Datei zu Datei funktioniert.

Mir ist klar, dass dies ein schwieriges Forschungsproblem ist, aber auch eine 80% ige Lösung könnte praktikabel sein.

3
Sollte [text-to-text] (http://superuser.com/questions/tagged/speech-to-text) anstelle von Text-to-Speech markiert werden. Nur ein Heads-Up. Corey vor 14 Jahren 0
Wie vorgeschlagen neu markiert. sleske vor 14 Jahren 0

2 Antworten auf die Frage

3
sleske

I believe the best free speech recognition software is CMU Sphinx. It looks quite mature, though I have not used it. It is however more a research project than focussed on end users, so while it apparently works well, it's a bit of work setting it up; in particular, you will need to train it before using it.

Other software you might want to try:

http://en.wikipedia.org/wiki/List_of_speech_recognition_software

BTW, have you considered just listening to the messages using a small earplug if you're in a meeting. Might be the easiest way :-). Or, just have less meetings...

1
patrick

Look at Julius

mkdir -p $HOME/tmp/ cd $HOME/tmp if [ ! -f Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz ] ; then wget http://www.repository.voxforge1.org/downloads/Nightly_Builds/AcousticModel-2011-07-21/Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz -O Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz fi tar xvpfz Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz echo "It might be installed."