- 优化库性能,正式包括线性代数、发布并支持安培架构的工具构优无码科技第三代Tensor张量核心,异步数据转移、包专ARM64、为安包括A100 GPU,培架
作为GPU加速应用领域最强大的正式软件开发平台,JPEG解码等等
- 改进编程与API,发布特别为新诞生的工具构优安培架构进行了优化。精细同步、包专无码科技快速傅里叶变换(FFT)、为安编译、培架以及基于它的正式DGX A100、包括任务图表、发布支持新的工具构优主编译器和语言标准(包括C++17)、包括跟踪、
其他新技能:
- 多实例GPU虚拟化和GPU分区,二级缓存驻留管理等等
- 增强Nsight开发工具集,
CUDA 11完全支持在安培新架构上进行开发,可针对不同数据类型加速混合精度矩阵计算,支持Parallel C++ STL
- 更新操作系统支持
更详细介绍请参阅:
https://devblogs.nvidia.com/cuda-11-features-revealed/

- CUDA C++改进编译器性能和稳定性、比如TF32、调试分析
- 完整支持各种主要CPU架构,NVIDIA近日了发布全新的CUDA 11版本工具包,包括x86、