Spracherkennung - MP3 zu Text-Software

23277
pako

Ich suche ein sprecherunabhängiges Programm (kommerziell oder kostenlos), mit dem ich MP3-Dateien mit Sprachaufnahmen (insbesondere Podcasts) in Text umwandeln kann. Ich wollte Dragon Naturally Speaking ausprobieren, aber es scheint, als würde es nur das Transkribieren meiner eigenen Sprachaufnahmen unterstützen. Was sind die Alternativen?

15
Kommentar von Avi: Ich glaube nicht, dass das möglich ist - unabhängig vom Sprecher Ivo Flipse vor 14 Jahren 0
welches Betriebssystem? studiohack vor 14 Jahren 0
Windows oder Linux. pako vor 14 Jahren 0

6 Antworten auf die Frage

7
moioci

Dragon Naturally Speaking importiert MP3-Dateien und versucht, sie zu transkribieren. Die Spracherkennung wird vorzugsweise auf die einzelnen Sprecher abgestimmt, sie leistet jedoch einen fairen Job ohne Abstimmung. Es würde wahrscheinlich am besten funktionieren, wenn Ihre Podcast-Lautsprecher wie Tom Brokaw klingen.

Ich habe Dragon Naturally Speaking ausprobiert, was Podcasts mit unbekannten Sprechern jedoch furchtbar gemacht hat. Es hat nur mit meiner eigenen Stimme recht gut funktioniert, nachdem ich das Programm trainiert habe. pako vor 14 Jahren 2
Kann es auch andere Audiodateien importieren und transkribieren? Larry Morries vor 13 Jahren 1
4
studiohack

One possible solution would be to upload your video to Youtube, and try the automatic captions that you can enable...it is not too accurate yet, but you can download the captions file and edit it yourself, if that helps...as for copyright/piracy issues for the song, you could make the video private on your profile, if that's even possible?

@studioback: Wird diese Methode von Youtube nur auf das eigene Video angewendet, nicht auf die von anderen hochgeladenen Videos? Tim vor 13 Jahren 1
@ Tim: es ist eigentlich für beide. studiohack vor 13 Jahren 1
@studiohack: Wie mache ich das für Videos, die von anderen hochgeladen wurden? Ich meine, ohne meine eigenen Videos herunterzuladen und hochzuladen? Tim vor 13 Jahren 1
Bei * den meisten * Videos befindet sich unten ein CC-Symbol. Klicken Sie darauf und dann auf die automatische Transkription. studiohack vor 13 Jahren 1
Vielen Dank! Bei den meisten Videos, die ich gesehen habe, gibt es kein CC-Symbol. Weißt du, welche Videos es gibt und was nicht? Ich beziehe mich nur auf englischsprachige Videos. Tim vor 13 Jahren 0
Ich habe das @ Tim bemerkt, weiß aber nicht, warum das so ist ... studiohack vor 13 Jahren 0
[Verwandte Frage: Wie kann die Spracherkennung von Google verwendet werden, ohne dass Videos auf YouTube hochgeladen werden?] (Http://superuser.com/q/734939/287352) Noch keine Antworten; Ich habe es gerade vor 10 Minuten gefragt. fredsbend vor 10 Jahren 3
2
nvuono

Ich würde davor warnen, Dragon Naturally Speaking zu versuchen. Ich habe einige Skripts auf meinem iPhone mit dem Namen Jailbroken geschrieben, um alle Voicemail-Dateien von meinem Telefon in einen Ordner auf meinem PC zu kopieren / umzuwandeln und den Dragon Naturally Speaking-Transkriptionsdienst gegen sie ausführen zu lassen.

Das Ergebnis der Transkription gegen Dateien mit verschiedenen Sprechern war absolut unbrauchbar. Ich habe einige der Open-Source-Alternativen ausprobiert, aber die sprecherunabhängige Spracherkennung scheint immer noch auf sehr kleine Wörterbücher beschränkt zu sein.

1
Juan Antonio Tubío

Ich verwende http://www.voicebase.com mit Podcast und Videos auf Englisch und es funktioniert sehr gut. Es ist kostenlos für 50 Audiostunden.

Sie können die Audio-Transkription auf RTF, SDR oder PDF herunterladen.

Sie können Maschinentranskriptionen etwa 10-15 Minuten nach dem Hochladen und manchmal auch zu einem früheren Zeitpunkt herunterladen.

1
BlueBerry - Vignesh4303

Open Source: CMU-Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Kommerziell: Dragon NaturallySpeaking (Windows)

Sie können diese Methode auch ausprobieren, wenn Sie mit osx versuchen, was mit Audacity und Soundflower möglich ist

Sie können auch einige relevante Links zu OpenSource finden, eine weitere Shareware, die es wert ist, voxcribecc auszuprobieren

Wenn Sie ein .NET-Programmierer sind, können Sie diese Methode verwenden, um Ihr eigenes Kit zu erstellen

0
Zach

Podzinger would be a great solution, but I'm not sure that ramp (the new name for the company that used to be EveryZing, who produced Podzinger) offers the service for free anymore...

http://en.wikipedia.org/wiki/Podzinger