地球科学应用程序,加速的瓶颈在哪,比如memory bottleneck Computing performance等。
清华大学计算机系博士后甘霖:
上述的瓶颈大部分都有,对于大气模式,它是一个代码量很大的工程,有时候一个程序中就有上千行代码,在程序进行到一开始时,很有可能像Stencil一样是一个慢慢的Memory bottleneck,这会使得在取数据时不便于去访存等。当访存完之后,由于有一些sin、cos(正弦和余弦)等数学函数的存在,因此又变成了计算bottleneck。这时对访存的优化解决方案是通过异构把仿存的时间包括通讯时间隐藏起来,而对于sin、cos(正弦和余弦)等数学函数是通过GPU的高并发度来完成相应的计算访存优化。