Warum treten beim Konvertieren von 16-Bit-Wellen in 8-Bit-Wellen Rauschen auf? Wie vermeiden Sie es?

6426
LiuYan 刘研

Wir haben einige 16bit / 8000HZ / Mono / PCM .wav-Dateien, die wir in 8bit konvertieren müssen, um sie in unserem Telefonsystem verwenden zu können.

Nach der Konvertierung stellten wir jedoch fest, dass in den 8-Bit-WAV-Dateien viele Störungen auftreten, auch wenn die gesamten Quellgeräusche stumm sind. (Sie können Audacity verwenden, um Stille zu generieren, sie in 16-Bit-Microsoft WAV und dann in 8-Bit-Microsoft WAV (Andere unkomprimierte Dateien) zu exportieren, um zu hören, was passiert ist.)

Ich habe versucht, Audacity, SOx, CoolEdit ( Versuch ) eine solche Umwandlung zu tun, sie alle nach der Umwandlung noised produzieren.

Wie ist das passiert? Und gibt es eine Möglichkeit, dies zu vermeiden?

3

2 Antworten auf die Frage

5
Yetanotherjosh

Es ist möglich, dass das Rauschen, auf das Sie sich beziehen, Dither ist . Viele Bitratenkonvertierungsalgorithmen fügen dem Signal vor der Konvertierung ein Dither hinzu, bei dem es sich um ein frequenzförmiges Rauschen mit niedriger Amplitude handelt. Dieses Rauschen erhöht in den meisten Fällen die hörbare Konvertierungsqualität. Wenn Sie kein Dithering wünschen, können Sie es hoffentlich mithilfe der Anwendungseinstellungen deaktivieren.

3
Paul R

Ohne die 8-Bit-Sounds zu hören, ist es schwer zu sagen, über welche Art von Geräuschen Sie sprechen, aber es gibt eine Reihe möglicher Probleme:

(1) Beim Konvertieren von 16 Bit in 8 Bit geht immer ein genereller Qualitätsverlust ein - schließlich werfen Sie Informationen weg.

(2) Wenn die 16-Bit-Samples nicht normalisiert werden (dh sie verwenden nur einen kleinen Teil des gesamten 16-Bit-Bereichs), haben sie eine sehr schlechte Qualität, wenn sie in 8 Bit konvertiert werden. Sie sollten sich zuerst normalisieren, um sicherzustellen, dass Sie es sind Verwendung des gesamten 8-Bit-Bereichs nach der Konvertierung.

(3) Es gibt zwei gemeinsame, aber unterschiedliche 8-Bit-Audiodarstellungen: vorzeichenbehaftet (Zweierkomplement) und vorzeichenlos (Offset), wobei letzteres die gebräuchlichste ist. Wenn Sie das falsche Format verwenden, z. B. in ein Format konvertieren und dann versuchen, das andere Format abzuspielen, ist der Ton zwar erkennbar, klingt jedoch ziemlich schlecht.

(4) Für Telefonanwendungen (Sprachanwendungen) ist es üblich, nicht-lineare (logarithmische) Kodierungen für 8-Bit-Audio zu verwenden, anstatt linear - die beiden gebräuchlichsten sind A-law und µ-law . Ihr konvertiertes 8-Bit-Audio ist jedoch linear. Wenn Sie versuchen, lineares PCM in einer Telefonanwendung zu verwenden, die ein A-Gesetz oder ein µ-Gesetz erwartet, klingt dies wie ein verzerrtes Chaos.