请问端到端的合成韵律预测部分是什么方案呢?
字节跳动智能语音方向工程负责人司徒文畅:
基于 BERT 的