Transkript-Ersteller ODER Rede zum Text

14027
AndyMcKenna

Ich höre einen täglichen Podcast, der ungefähr vier Stunden lang ist. Ich denke, es wäre ein cooles Projekt, wenn ich eine Möglichkeit hätte, Transkripte davon automatisch zu generieren. Gibt es eine Software, die die mp3s "hört" und Text von dem, was sie sagen, erstellt?

Ich bin nicht sehr darum bemüht, zu unterscheiden, wer spricht, weil ich denke, das würde zu viel verlangen. Es sprechen 4 Hauptpersonen und andere weniger.

3

7 Antworten auf die Frage

3
ToreTrygg

Schritte:

  1. Laden Sie den kostenlosen Transkriptions-Player Express Scribe herunter und installieren Sie ihn.
    1. Sobald die Anwendung installiert ist, finden Sie eine Beispiel-Diktatdatei, die bereits geladen ist. Dadurch haben Sie die Möglichkeit, mit den Steuerelementen und Optionen zu experimentieren, um die Anwendung Ihren Bedürfnissen anzupassen.
    2. Klicken Sie im Hauptfenster auf die Schaltfläche Einstellungen.
    3. Mit Express Scribe können Sie einige Parameter ändern oder einstellen, darunter Rücklauf- und Schnellvorlaufgeschwindigkeiten, systemweite Hotkeys (zur Steuerung der Anwendung ohne Verwendung einer Maus), Einrichten einer Fußpedalsteuerung (falls vorhanden), automatisches Laden von Dateien Wählen Sie aus einem LAN-Ordner oder einem FTP-Server die gewünschten Dateitypen aus (über 20 werden unterstützt) und richten Sie eine Spracherkennungs-Engine ein.
    4. Nachdem Sie Ihre Optionen eingerichtet haben, können Sie jetzt Ihre erste Audiodatei laden. Je nachdem, von wo Sie sie empfangen, können Sie entweder auf Laden klicken (es öffnet sich ein Dialogfeld, in dem Sie nach der Datei auf Ihrem PC suchen können), Jetzt laden (wenn Sie eine LAN- oder FTP-Verbindung eingerichtet haben) oder Dock (wenn Sie einen Digital- oder Kassetten-Diktierrecorder dabei haben müssen).
    5. Wählen Sie die Audiodatei im Hauptfenster der Benutzeroberfläche aus und klicken Sie zum Starten auf die Schaltfläche Wiedergabe. Falls erforderlich, verlangsamen oder beschleunigen Sie die Audiowiedergabe mithilfe des Geschwindigkeitsreglers in der rechten unteren Ecke. Über diesem Regler können Sie auch die Wiedergabelautstärke einstellen.
    6. Wenn Sie möchten, dass Express Scibe über Ihrer Textverarbeitungsanwendung angezeigt wird, können Sie Scribe Mini in der Symbolleiste der Benutzeroberfläche auswählen. Wie der Name vermuten lässt, bietet diese Option eine Miniture-Version der Anwendung.
    7. Wenn Sie Ihre Audiodateien fertig transkribiert haben, können Sie sie entweder als "Fertig" (Entfernen der Datei aus Ihrer Liste) oder "Dispatch" (Zurücksenden und Senden an den ursprünglichen Absender zusammen mit Ihrem Trext-Anhang und Entfernen der Audiodatei aus Ihrer Liste) markieren .

Tipps

  • Nehmen Sie sich etwas Zeit, um alle Optionen der Anwendung zu erkunden.
  • Wenn Sie eine Audiodatei von schlechter Qualität erhalten, können Sie im Menü "Datei" die Option "Spezielle Audioprozesse" auswählen, um sie zu bereinigen.
  • Wenn Express Scribe eine Audiodatei empfängt, wird diese unter C: \ Dokumente und Einstellungen \ Benutzername \ Anwendungsdaten \ NCH Swift Sound \ scribe \ Current gespeichert
  • Wenn Sie eine Audiodatei als "Fertig" markiert haben, sie aber zurückholen möchten, können Sie alte Dateien über das Menü "Datei" wiederherstellen.
Ich glaube nicht, dass das Plakat eine manuelle Transkription wollte. JeffP vor 14 Jahren 2
1
studiohack

One thing you could try (although not on a daily basis) is uploading the audio as a video to Youtube, then asking YouTube to transcribe the video, giving you English captions...can take up to 24 hours for YouTube to do this, however...The caption file is even downloadable and you can edit them yourself, so you could copy and paste the text to wherever you wanted...

Fantastischer Trick :) Obwohl es nicht perfekt ist, aber ziemlich gut funktioniert .. Mohib Sheth vor 12 Jahren 0
0
Snark

Sie benötigen eine Spracherkennungssoftware .

Dafür gibt es mehrere Programme, aber ich kenne keine, die Batch-Konvertierungen durchführen können. Ich bin mir ziemlich sicher, dass es sich bei mindestens einem von ihnen um ein Feature handelt. Beachten Sie, dass die meisten von ihnen nicht billig sind.

0
DaveParillo

Versuchte Welle zum Text ? Es ist nur Windows und hat eine begrenzte kostenlose Testversion.

Wie viele Stimmen sind in diesen Dateien? Enthalten alle Dateien die Sprache einer (trainierbaren) Stimme? Was ist die Audioqualität? Wenn die Antworten auf diese Fragen nicht lauten: 'Nur ich', 'Ja' und 'CD-Qualität', @Snark ist richtig, müssen Sie dies im Wesentlichen manuell tun. Holen Sie sich ein gutes Spracherkennungsprogramm, trainieren Sie es und spielen Sie Ihre Dateien ab, während Sie versuchen, zu sagen, was sie sagen.

Erwarten Sie eine erfolgreiche Transkription von 90% bis 95%. Das klingt großartig, bis Sie feststellen, dass 1 oder 2 von 20 Wörtern falsch sind.

Andere Faktoren, die die Genauigkeit beeinflussen können:

  1. Viele Akronyme in Ihrer Rede
  2. unvollständige Sätze - Sprache zu Text tendiert dazu, mit den Kontexthinweisen aus vollständigen Sätzen viel besser zu arbeiten.
0

Ich verwende Dragon NaturalSpeaking für die Transkription. ausgezeichnete Software!

Amazon bietet jedoch die aktuelle Version 10 für 45 US-Dollar an . Wenn Sie sich umsehen, erhalten Sie DNS9 sogar noch günstiger.

Kann es jedoch aus einer Datei transkribieren? Es gibt viele Programme, die dies tun, aber viele hören nur von einem Live-Mikrofon Paul Betts vor 14 Jahren 0
Transkribieren einer Aufnahme mit Dragon Naturally Speaking: http://wiki.wsu.edu/ctowiki/Transcribing_a_recording_with_Dragon_Naturally_Speaking vor 14 Jahren 0
Ja, das ist möglich - obwohl ich mich erinnere, dass Sie die Preferred-Version oder eine höhere Version benötigen, um diese Funktion zu aktivieren, obwohl ich das scheinbar nicht beweisen kann ... http://www.nuance.com/naturallyspeaking/resources/product- Matrix.asp Goyuix vor 14 Jahren 0
0

The problem with Dragon Naturally Speaking in a context like this is that you really wouldn't be able to go through the training process where it learns to accurately interpret the speech. It's not intended for this kind of use. Maybe the NSA has some software to do this sort of thing. :)

Ich bin nicht mit dem Training von Spracherkennungsprogrammen vertraut, aber es scheint, als könnten Sie es "trainieren", indem Sie immer wieder kurze Ausschnitte des Podcasts wiedergeben - im Grunde die gleiche Art und Weise, wie Sie es mit Ihrer eigenen Stimme trainieren. sicherlich nicht automatisch tho. quack quixote vor 14 Jahren 0
@ quack quixote: problem ist, es ist schon schwer genug, es auf deine stimme zu trainieren, ganz zu schweigen von 4-5 anderen stimmen ... Als ich Dragon 9 ausprobierte, war es nicht in der Nähe, wo es hätte sein sollen (oder wo ich dachte es sollte sein) ... studiohack vor 14 Jahren 0
-1
moshen

Ich bin mir ziemlich sicher, dass Dragon das zulässt. Sie könnten jedoch Probleme mit der Genauigkeit haben.

Autsch, ein bisschen teuer bei 199 $. AndyMcKenna vor 14 Jahren 0
Drache ist nicht stark genug. Ich habe es ausprobiert. studiohack vor 14 Jahren 1
Auch heute, im Jahr 2014, ist Dragon nicht anders. Damit es gut funktioniert, müssen Sie es auf die sprechende Stimme "trainieren", indem Sie bis zu 500 Wörter aus einer Textdatei lesen. Selbst dann wird die Interpunktion mehr als die Hälfte der Zeit verpasst. fredsbend vor 10 Jahren 0