对一个大型应用程序,在GPU上并行加速的时候,一般的步骤都有哪些?可否分享一下您的经验?
清华大学计算机系副教授都志辉:
其实我在前面讲的时候也大概说了一下,对一个大型应用程序在GPU上并行加速的时候,不要直接就往上移植,最好是先好好分析一下这个程序,先把问题、结构和流程搞清楚。然后再把你往GPU移植所要采取的手段和方法也想清楚,之后再动手。我们一般说性能优化,包括三个方面:应用、算法和硬件体系结构。那么移植也差不多,先把应用搞明白,再去移植,然后你再考虑如何用算法来实现,最后再结合GPU和硬件来做这件事情。
问题来源