请问音乐音转文模型和普通场景音转文模型一致吗?
字节跳动智能语音方向工程负责人司徒文畅:
目前为了效果更好是分开的