什么应用适合 GPU (What Application GPUs Suit)
▪ 内核中有众多并行线程的应用
▪ 对于线程间的数据交换都发生在 kernel 调度空间中的相邻线程之间的应用,因为这样就可以用到 per-block shared memory.
▪ 数据并行的应用,多个线程做相似工作,循环是数据并行的主要来源。
▪ 那些能得到很好的天然硬件支持的应用,如倒数和反平方根,不过在编程中要打开"fastmath"选项,确保使用硬件支持功能。
▪ 需要对每个数据元素做大量的计算,或者能够充分利用宽内存接口(wide memory interface 这里有疑问)
▪ 做同步操作较少的应用。
问题来源