Раньше не было никаких проблем с публикацией видео из статической картинки с аудиосопровождением на ютубе, я обычно делал так:
ffmpeg -t <время показа картинки> -loop 0 -i in.jpg -t <время звучания музыки> -i in.mp3 out.avi
или так:
mencoder mf://in.png -mf fps=1/<время показа картинки>:type=png -audiofile in.mp3 -ovc lavc -oac copy -vf harddup -lavcopts vcodec=flv:vqscale=2:keyint=5 -ofps 1 -of lavf -o out.flv
Загружалось и перекодировалось всё обычно в ноль секунд, теперь какие форматы не возьми, какое разрешение картинки не возьми — результат один:
Ошибка (преобразование видеофайла невозможно)