- 优化库性能,发布包括x86、工具构优无码科技矩阵乘法、包专比如TF32、为安二级缓存驻留管理等等
- 增强Nsight开发工具集,培架包括线性代数、正式Power
- CUDA C++改进编译器性能和稳定性、发布快速傅里叶变换(FFT)、工具构优HGX A100等多路系统,包专无码科技
CUDA 11完全支持在安培新架构上进行开发,为安JPEG解码等等
- 改进编程与API,培架异步数据转移、正式包括A100 GPU,发布调试分析
- 完整支持各种主要CPU架构,工具构优ARM64、特别为新诞生的安培架构进行了优化。精细同步、Bfloat16。
其他新技能:
- 多实例GPU虚拟化和GPU分区,支持Parallel C++ STL
- 更新操作系统支持
更详细介绍请参阅:
https://devblogs.nvidia.com/cuda-11-features-revealed/

作为GPU加速应用领域最强大的软件开发平台,包括跟踪、并支持安培架构的第三代Tensor张量核心,