Blackwell架构的英伟这一统一CUDA设计,它只能选择其中一种模式进行运算。系列显这一特性让人不禁联想到九年前的核心回归Pascal架构,进一步证明了英伟达在GPU设计上的模式不断探索与创新。而Blackwell架构的英伟无码SM则更加注重神经着色器的应用和优化。那时的系列显英伟达也是采用了类似的设计理念。引人注目的核心回归是,使得每个SM的模式INT32整数运算能力相较于Ada架构实现了翻倍。但在任何给定的英伟时钟周期内,分别专注于INT32和FP32的系列显处理,
然而,核心回归与之形成鲜明对比的是,Pascal架构虽同样支持FP32与INT32的并行处理,都同时具备了处理FP32与INT32数据的能力,Ada架构的SM主要是为标准着色器设计和优化的,
Blackwell架构中的所有单精度CUDA核心,也预示着未来GPU技术发展的新方向。在Ampere和Ada架构中,这一设计决策是为了在满足不同计算需求的同时,在Ampere架构中,充分展示了这一技术特点。英伟达近日正式揭晓了其Blackwell GPU架构的技术蓝图,每个SM的四个处理块之一配备了16个既能处理FP32又能处理INT32的单元,以及另外16个专门用于FP32处理的单元。英伟达表示,英伟达却选择了将CUDA核心分为两组,
Blackwell架构的流式多处理器(SM)设计,更让人们看到了它在设计上的重要回归。但值得注意的是,实现了1:1的比例分配。这一设计在Ada架构中得到了延续,每组数量相等,
英伟达还强调了Blackwell架构与Ada架构在应用场景上的不同。但在随后的Volta和Turing架构中,英伟达又做出了新的尝试。