每次是重现开始新的训练，模型效果会提升

主要有两个点，一是初始化可能导致结果不一样，另一个是现在的框架大多是non-deterministic的，并不能保证每次训练同样的参数同样的过程结果一致