というか、エンコード,デコードが発生するデジタルの音声や映像機器は
どれも大体、機器により遅延具合が異なるよね
音声の場合はデータ量が少ないから人間が体感できる場合や差が少ないけど