Da Sie eine aktuelle Version von ffmpeg verwenden, verwenden Sie den folgenden Befehl
ffmpeg -y -i ./images/video%04d.png -i music.wav -profile:v baseline -shortest -vcodec libx264 -s 720x480 -acodec aac -movflags +faststart video_file.mp4
profile
wird auf den kleinsten gemeinsamen Nenner gesetzt, baseline
um eine breite Kompatibilität zu gewährleisten. Die MOOV-Box wird an den Kopf der Datei verschoben, sodass nicht die gesamte MP4 heruntergeladen werden muss, bevor die Wiedergabe beginnen kann.
Wenn nicht anders angegeben, weist ffmpeg standardmäßig Bildfolgen eine Bildrate von 25 zu. Seit Dezember 2015 ist der native AAC-Encoder nicht mehr als experimentell gekennzeichnet.
Sowohl der Größenwert von 720x480 als auch der HTML5-Videogröße - 640x480 - lässt mich denken, dass Sie mit NTSC-Quellmaterial zu tun haben. Wenn ja, verwenden Sie
ffmpeg -y -framerate 30000/1001 -i ./images/video%04d.png -i music.wav -vf "scale=640x480,setsar=1' -profile:v baseline -shortest -vcodec libx264 -acodec aac -movflags +faststart video_file.mp4