视频配音的话,是读入整段视频呢?还是流媒体形式的?
字节跳动智能语音方向工程负责人司徒文畅:
目前是整段的