深度学习需要大量的样本,当识别效果不佳时,如何判断是样本问题和还是算法问题?
NVIDIA中国GPU应用市场总监侯宇涛:
这个问题也是目前经常存在的问题,由于在训练的过程当中,无法知道是数据集不合适还是算法不合适。我认为,这个时候不需要花太多精力去用一个不能定义的标准来判断另外一个不能定义的物体,而最好的办法就是能够带着你的数据去找一个模型进行迁移式训练的判断。比如在行业中,你了解到谁跟你做差不多的模型,你可以把这个模型拿过来,再把你的数据丢进去,如果这个数据是收敛的,那一定是算法问题,如果这个数据跑不通,那肯定是数据集的问题。
问题来源