比照原文,进行了细致校对,修正部分语法问题
- 前言
- 第1章:评估您的应用程序
- 第2章:异构计算
- 第3章:程序性能评估
- 第4章:程序并行化
- 第5章:着手程序并行化
- 第6章:正确地并行化
- 第7章:优化CUDA程序
- 第8章:性能指标
- 第9章:显存带宽优化
- 第10章:参数配置优化
- 第11章:指令优化
- 第12章:控制流
- 第13章:部署CUDA程序
- 第14章:理解编码环境
- 第15章:CUDA兼容性开发者指南
- 第16章:部署前准备
- 第17章:部署常规工具
- 附录A:建议和最佳实践
- 附录B:NVCC编译器选项
| Name | Name | Last commit date | ||
|---|---|---|---|---|