Der Stereo3d-Filter ist so ausgelegt, dass er auf einen einzigen Videostrom wirkt, bei dem Sequenzen für beide Augen bereits vorhanden und in irgendeiner Weise verschachtelt sind. Der Filter ändert dann das Anordnungsschema. Was Sie hier haben, sind zwei separate Streams, die kombiniert werden müssen.
Beim Abgleich haben beide Sequenzen die gleichen Videoeigenschaften (Auflösung, Dauer ..), verwenden
ffmpeg -framerate 60 -i "image_%05d_L.jpg" -framerate 60 -i "image_%05d_R.jpg" -filter_complex "hstack,format=yuv420p" -c:v libx264 -crf 15 -preset veryslow vid.mp4