ts2aacで音声を分離すれば
音声ch切り替えポイントで補正してくれる
ただソースがCS局だとamatsukazeに任せるぐらいしか手はないと思う

あくまでmp4にエンコードするのが前提の話だけど