Optimaler Audio-Codec und entsprechendes Format / Option für die Sprachaufzeichnung in kleinen und großen Hörsälen

Question

Optimaler Audio-Codec und entsprechendes Format / Option für die Sprachaufzeichnung in kleinen und großen Hörsälen

3678

jhstuckey 2012-02-06 в 23:10

Microsoft OneNote, das mit Office2010 geliefert wird, eignet sich sehr gut für Notizen-Software. Es enthält die Funktion zum Aufnehmen von Audio / Video oder nur Audio. Die Optionen im Programm für Codec sind a) Windows Media Audio 9, b) Windows Media Audio 9.2 und c) Windows Media Audio 10 Professional. Insbesondere beim letztgenannten Codec stehen viele Formate zur Verfügung, von <0 kbps, 8 kHz, Mono-CBR> bis <320 kbps, 44 kHz, Stereo (A / V> CBR>). Sie scheinen in zwei Kategorien unterteilt zu werden: A / V) und Nicht-A / V (was auch immer das bedeutet, ich weiß es nicht), und dann entsprechend ihrem kHz und dann von kbps. Außerdem werden Optionen für Stereo, Mono und das, was als "low delay" bezeichnet wird, ausgegeben CBR ".

Mit einem grundlegenden Verständnis dieser Begriffe könnte man vermuten, dass 320kbps 48Khz CBR für diese Nutzungsphilosophie übertrieben ist und 0kbps 9khz, Mono-CBR, was heutzutage mit 1-TB-Festplattenlaufwerken zu wünschen übrig lässt. Die Beantwortung der Frage, welches Format für diese Anwendungsphilosophie am besten geeignet ist, ist jedoch eine andere Frage, die möglicherweise ein anderes Wissensniveau erfordert als die meisten Menschen. Man könnte den "Try-it-and-see" -Ansatz wählen, aber diese Frage scheint für Superuser gut geeignet zu sein, um die Möglichkeit zu posten, zu posten.

Meine Frage ist also: Welche Codec / Format-Kombination eignet sich am besten für die Philosophie der Verwendung von Audioaufzeichnungen für Notizen in einem großen oder kleinen Hörsaal. Das könnten zwei Fragen sein; wäre ein bestimmter Codec in bestimmten Räumen wünschenswert?

ps subquestion: Was bezeichnet im professionellen Codec Windows Media Audio 10 das Format (A / V)?

2

Haben Sie jemals den Unterschied zwischen den Formaten A / V und Nicht-A / V WMA 10 herausgefunden? Brian Cauthon vor 11 Jahren 0

1 Antwort auf die Frage

2

Accepted Answer · 2012-02-07 03:11:12

Die Bitrate gibt an, wie gut das Audio durch eine bestimmte Datenmenge approximiert werden kann. Zu niedrige Bitraten führen zu einer verstümmelten Stimme, merkwürdigen Artefakten und unnatürlichen, geglätteten Transienten (kurze Töne wie der Buchstabe T). Höhere Bitraten stimmen zwar besser mit dem ursprünglichen Inhalt überein, sind jedoch möglicherweise unbrauchbar, wenn die Vorteile nicht deutlich hörbar sind (Overkill). Die variable Bitrate liefert immer eine bessere Qualität als die CBR mit konstanter Bitrate bei der gleichen gegebenen Bitrate, da der Encoder mehr Aufwand (Daten) auf die am schwersten zu codierenden Teile konzentriert.

Nennen wir Bitrate: Audio-Integrität .

Die Abtastrate beeinflusst das mögliche Frequenzspektrum, das eine Audiodatei haben kann. Der typische Wert beträgt 44 kHz, da er praktisch den gesamten hörbaren Bereich (0-22 kHz) abdeckt. Durch die Verringerung der Sample-Rate werden höhere Frequenzen gesenkt, die nicht mehr codiert werden. Dadurch wird die Codierung der verbleibenden Daten mit höherer Integrität vereinfacht. Durch das Verringern der Abtastraten kann jedoch das Hintergrundrauschen, das in den meisten Aufnahmen vorhanden ist, verändert werden. Dies kann zu unerwünschten Nebeneffekten (schärferes Rauschen) und möglicherweise zu Problemen mit der Zischlaute ("s" - Geräusche) oder zu normaler Leblosigkeit führen - selbst bei sehr hohen Bitraten. Das Senken der Abtastrate kann ein sehr effektiver Kompromiss sein, wenn mit sehr niedrigen Bitraten gearbeitet wird. Voice-over-IP-Telefonieprotokolle sind ein hervorragendes Beispiel dafür.

Rufen wir die Sample-Rate als Audio-Fülle auf .

Stereo: Wenn Ihr Sound meistens Mono ist, wie zB Sprache, verschwenden Sie die Hälfte der Bandbreite, indem Sie ihn als Stereo kodieren (es sei denn, es handelt sich um ein gemeinsames Stereo, aber das ist eine andere Geschichte).

Ich denke, mit Musik ist es allgemein bekannt, dass 128kbps 44.1khz Stereo mit MP3 der Wendepunkt ist, an dem fast jeder Musikschaden spürt und gleichzeitig hörbar ist. Da Sprache einfacher zu codieren ist als Musik, denke ich, dass das Monoäquivalent -MP3 64kbps 44.1khz - einen großartigen Ausgangspunkt mit ausreichender Qualität für die meisten Zwecke darstellt, ohne dabei zu viel zu tun.

Schließlich soll Windows Media Audio wesentlich effizienter sein als MP3. Sie können diese Referenzpunkte also leicht um 25-40% ausgleichen (zB WMA 40kbps sollte MP3 64kbps ähnlich sein). WMA Professionnal soll besser als WMA 9 sein, da es offensichtlich die Anzahl der Codierungsoptionen für niedrige Bitraten von WMA9 reduziert und automatisch die beste Methode für die meisten Inhalte verwendet. Wenn Sie es also nicht auf Geräten abspielen möchten, die nur WMA9 unterstützen, ist dies wahrscheinlich die bessere Option.

Hoffentlich können Sie sich von dort nach oben (oder nach unten) arbeiten.

Optimaler Audio-Codec und entsprechendes Format / Option für die Sprachaufzeichnung in kleinen und großen Hörsälen

1 Antwort auf die Frage

Verwandte Probleme