FFMPEG liest mehrere Audiospuren auf Lautstärke, Stille oder Statistik

568
DMtd

Ich muss in der Lage sein, eine Videodatei mit mehreren Audiospuren zu analysieren und die Ergebnisse in eine Textdatei auszugeben. Ich weiß, dass es mehrere Filter gibt, die mir die Ergebnisse liefern können, nach denen ich danach strebe, aber ich finde fast keine Informationen zur Syntax. Letztendlich habe ich ein Video mit 3 Audiospuren (2 Kanäle pro Spur). Spur 1 (0: 1) enthält Stereo-Audio, die anderen (0: 2, 0: 3) sind stumm. Gibt es eine Möglichkeit, entweder den Volumedetect-Filter, den Silencedetect-Filter oder den Astats-Filter zu verwenden, um diese Audiospuren zu lesen und mir diese Informationen zur Verfügung zu stellen?

Bisher habe ich versucht:

ffmpeg -i "mov" -af astats=metadata=1:reset=1,ametadata=print:key=lavfi.astats.Peak_level.Peak_count:file=log.txt -f null -y "log.txt"

Was ich bekomme ist eine TXT-Datei mit diesem Header und keinen Metadaten:

;FFMETADATA1 major_brand=qt minor_version=512 compatible_brands=qt encoder=Lavf57.72.101 

Konsolenausgabe ist:

video:3867kB audio:56252kB subtitle:0kB other streams:0kB global headers:0kB mux ing overhead: unknown [Parsed_astats_0 @ 000000000206ec00] Channel: 1 [Parsed_astats_0 @ 000000000206ec00] DC offset: 0.002583 [Parsed_astats_0 @ 000000000206ec00] Min level: -188217600.000000 [Parsed_astats_0 @ 000000000206ec00] Max level: 159772160.000000 [Parsed_astats_0 @ 000000000206ec00] Min difference: 512.000000 [Parsed_astats_0 @ 000000000206ec00] Max difference: 7082496.000000 [Parsed_astats_0 @ 000000000206ec00] Mean difference: 1883352.211144 [Parsed_astats_0 @ 000000000206ec00] RMS difference: 2358521.937019 [Parsed_astats_0 @ 000000000206ec00] Peak level dB: -21.145393 [Parsed_astats_0 @ 000000000206ec00] RMS level dB: -28.110640 [Parsed_astats_0 @ 000000000206ec00] RMS peak dB: -28.110640 [Parsed_astats_0 @ 000000000206ec00] RMS trough dB: -28.110640 [Parsed_astats_0 @ 000000000206ec00] Crest factor: 2.229782 [Parsed_astats_0 @ 000000000206ec00] Flat factor: 0.000000 [Parsed_astats_0 @ 000000000206ec00] Peak count: 2 [Parsed_astats_0 @ 000000000206ec00] Bit depth: 24/24 [Parsed_astats_0 @ 000000000206ec00] Channel: 2 [Parsed_astats_0 @ 000000000206ec00] DC offset: 0.002886 [Parsed_astats_0 @ 000000000206ec00] Min level: -182797568.000000 [Parsed_astats_0 @ 000000000206ec00] Max level: 178699776.000000 [Parsed_astats_0 @ 000000000206ec00] Min difference: 3584.000000 [Parsed_astats_0 @ 000000000206ec00] Max difference: 7476224.000000 [Parsed_astats_0 @ 000000000206ec00] Mean difference: 1951990.490714 [Parsed_astats_0 @ 000000000206ec00] RMS difference: 2428434.732920 [Parsed_astats_0 @ 000000000206ec00] Peak level dB: -21.399189 [Parsed_astats_0 @ 000000000206ec00] RMS level dB: -28.031096 [Parsed_astats_0 @ 000000000206ec00] RMS peak dB: -28.031096 [Parsed_astats_0 @ 000000000206ec00] RMS trough dB: -28.031096 [Parsed_astats_0 @ 000000000206ec00] Crest factor: 2.145830 [Parsed_astats_0 @ 000000000206ec00] Flat factor: 0.000000 [Parsed_astats_0 @ 000000000206ec00] Peak count: 2 [Parsed_astats_0 @ 000000000206ec00] Bit depth: 24/24 [Parsed_astats_0 @ 000000000206ec00] Overall [Parsed_astats_0 @ 000000000206ec00] DC offset: 0.002886 [Parsed_astats_0 @ 000000000206ec00] Min level: -188217600.000000 [Parsed_astats_0 @ 000000000206ec00] Max level: 178699776.000000 [Parsed_astats_0 @ 000000000206ec00] Min difference: 512.000000 [Parsed_astats_0 @ 000000000206ec00] Max difference: 7476224.000000 [Parsed_astats_0 @ 000000000206ec00] Mean difference: 1917671.350929 [Parsed_astats_0 @ 000000000206ec00] RMS difference: 2393733.587876 [Parsed_astats_0 @ 000000000206ec00] Peak level dB: -21.145393 [Parsed_astats_0 @ 000000000206ec00] RMS level dB: -28.070686 [Parsed_astats_0 @ 000000000206ec00] RMS peak dB: -28.031096 [Parsed_astats_0 @ 000000000206ec00] RMS trough dB: -28.110640 [Parsed_astats_0 @ 000000000206ec00] Flat factor: 0.000000 [Parsed_astats_0 @ 000000000206ec00] Peak count: 2.000000 [Parsed_astats_0 @ 000000000206ec00] Bit depth: 24/24 [Parsed_astats_0 @ 000000000206ec00] Number of samples: 1024 

Problem ist, dass die Audiospuren 2 und 3 ignoriert werden.

Wie lese ich mehrere Audiospuren?

Vielen Dank.

1

0 Antworten auf die Frage