Ist es möglich?
Nein.
Wenn Sie ein Musikstück von einem Standpunkt der Signalverarbeitung aus betrachten, wird nur ein Signal mit bestimmten Frequenzen gesendet. Menschen sind großartig darin, menschliche Sprache psychoakustisch auszufiltern oder aus der Musik zu singen, aber ein Computer kann das nicht.
Das Problem ist, dass sowohl Musik als auch Gesang gemischt werden und die Frequenzen der menschlichen Stimme (300 Hz - 3,4 kHz) mit den meisten Musikinstrumenten (z. B. einem Klavier von 28 Hz bis 4,1 kHz) überlappen. Sie können also bestimmte Frequenzen nicht abschneiden und erhalten dafür nur Gesang. Es ist einfach nicht machbar.
"... aber gibt es" Vocal Remover "-Programme?" Sie können fragen.
Einige Vocover-Remover-Programme machen sich die Tatsache zunutze, dass Pop-Songs normalerweise so gemischt werden, dass Vocals auf dem linken und rechten Kanal gleich laut sind, sodass sie zentriert in einem Stereopanorama erscheinen. Wenn Sie alles, was zentriert ist, herausfiltern, bleiben gesperrte Instrumente (normalerweise Gitarren) übrig, aber Sie entfernen auch andere zentrierte Instrumente wie Bass Drums, Bassgitarre oder Snare-Drums.
Einfach gesagt, selbst wenn Sie andere Programme wie Vocal Remover oder das Programm in Audacity finden, klingt das einfach beschissen. Weil nicht jeder Song so gemischt ist und Reverbation-Effekte auf Vocals auch im Stereopanorama erscheinen.