1. Разделяешь потоки на видео и аудио через
New Task -> Advanced Tools -> Extract Video and Audio
2. Конвертишь аудио в нужный тебе формат.
3. Склеиваешь видео с переконверченным аудио
New Task -> Advanced Tools -> Multiplex Video and Audio