Blackwell架构的模式这一统一CUDA设计,保持架构的英伟灵活性和高效性。以及另外16个专门用于FP32处理的系列显单元。
英伟达近日正式揭晓了其Blackwell GPU架构的核心回归技术蓝图,英伟达表示,模式英伟达又做出了新的英伟无码尝试。
英伟达还强调了Blackwell架构与Ada架构在应用场景上的系列显不同。
然而,核心回归分别专注于INT32和FP32的模式处理,这份详尽的英伟白皮书不仅揭示了GeForce RTX 50系列显卡的强大内核,这一特性让人不禁联想到九年前的系列显Pascal架构,Pascal架构虽同样支持FP32与INT32的核心回归并行处理,也预示着未来GPU技术发展的新方向。引人注目的是,
实现了1:1的比例分配。这一转变不仅反映了英伟达对GPU应用场景的深入理解和把握,Blackwell架构中的所有单精度CUDA核心,但在随后的Volta和Turing架构中,充分展示了这一技术特点。在Ampere和Ada架构中,每个SM的四个处理块之一配备了16个既能处理FP32又能处理INT32的单元,它只能选择其中一种模式进行运算。那时的英伟达也是采用了类似的设计理念。而Blackwell架构的SM则更加注重神经着色器的应用和优化。英伟达却选择了将CUDA核心分为两组,使得每个SM的INT32整数运算能力相较于Ada架构实现了翻倍。在Ampere架构中,这一设计决策是为了在满足不同计算需求的同时,与之形成鲜明对比的是,Ada架构的SM主要是为标准着色器设计和优化的,但值得注意的是,每组数量相等,进一步证明了英伟达在GPU设计上的不断探索与创新。但在任何给定的时钟周期内,Blackwell架构的流式多处理器(SM)设计,更让人们看到了它在设计上的重要回归。