摘 要:虽然Fortran常用来进行科学计算,但是面对计算量大的程序仍然很耗时。通常人们用MPI进行粗粒度的并行来 提高程序的运行效率,近年来随着GPU计算能力的提高,将程序进行细粒度GPU并行化成为一种趋势。文章基于NVIDIA公 司的CUDA框架,就Fortran程序向CUDA移植过程中的一些问题进行总结,并给出了相应的解决方案。
加入Vishay电子学习社,优质资源限时免费放送
成就高薪工程师的非技术课程
自己动手从0到1写嵌入式操作系统
跟我学DC-DC电源管理技术——第二章,DC-DC的工程实践
2.1.uboot学习前传
内容不相关 内容错误 其它