-
转写的标点符号没看到?
字节跳动智能语音方向工程负责人司徒文畅: 字幕场景目前是故意不加标点... 全文>
-
如果一段音频有好几个人讲话,能识别出哪些话是第一个人说的,哪些话是第二个人说的吗?
字节跳动智能语音方向工程负责人司徒文畅: 答案是可以,这里介绍两个方案,第一个是无监督的... 全文>
-
问题
答案... 全文>
-
训练模型的时候,发现多次训练,模型的推理能力会有提升,这是偶然事件吗?
NVIDIA数据科学家徐添豪: 如果是模型的效果上,这种情况有可能发生,相当于你的模型可... 全文>
-
如果公司有大量的原始音频数据,如何筛选数据,以及起步去建立自己的模型?有哪些要素是必须要有的?
字节跳动智能语音方向工程负责人司徒文畅: 我们一般把这个问题叫冷启动问题,其实对于冷启动... 全文>
-
在音乐检索领域,目前有没有“音乐转歌词”的相关研究和项目推荐?
字节跳动智能语音方向工程负责人司徒文畅: 对于这个问题其实有两种理解,一种是你是想说通过... 全文>
-
每次是重现开始新的训练,模型效果会提升
NVIDIA数据科学家徐添豪: 主要有两个点,一是初始化可能导致结果不一样,另一个是现在... 全文>
-
T4 4卡负载率低的问题如何解决?硬件还是软件?
NVIDIA数据科学家徐添豪: 从软件角度来看,不太确定用的是哪一个框架,不同的框架实现... 全文>