每次是重现开始新的训练,模型效果会提升
NVIDIA数据科学家徐添豪:
主要有两个点,一是初始化可能导致结果不一样,另一个是现在的框架大多是non-deterministic的,并不能保证每次训练同样的参数同样的过程结果一致