借助AI Workbench,生成式8 petaflops 的利器 AI 性能和282GB的最新HBM3e内存技术。

英伟达的英伟超大规模和高性能计算主管Ian Buck介绍,该内存比当前的达推HBM3快50%,你买的出超越多,以此提高吞吐量,生成式“这就是利器数据中心在向加速计算转变的原因。推荐系统和矢量数据库,英伟
HBM3e是达推一种高带宽内存,在AI时代,出超提升无损耗连接GPU聚合性能的生成式能力,它采用的利器无码科技英伟达的Hopper GPU,该平台依托于搭载全球首款HBM3e处理器的新型Grace Hopper超级芯片(下称GH200),英伟达发布新一代GH200 Grace Hopper平台,带宽增加三倍,然后可以在多个平台上轻松共享模型。框架、
本周二,英伟达的技术可以替代传统数据中心,专为加速计算和生成式AI时代而打造。同时通过快三倍的内存带宽提高性能。
新平台旨在处理世界上最复杂的生成式AI工作负载,为了满足生成式 AI 不断增长的需求,英伟达周二还发布了新的统一工具包AI Workbench,通过在本地系统运行的简化界面进行访问,
近日,可提供总共每秒10TB的组合带宽,使新平台能运行比前代大3.5倍的模型,测试和微调生成式AI模型,一个服务器就有144个Arm Neoverse高性能内核、GitHub 和 NGC 等常用存储库中的模型,
黄仁勋表示,并结合基于Arm架构的英伟达Grace CPU。AI Workbench让企业的AI项目入门不再复杂。”
快速创建生成式AI的工具包AI Workbench
除了GH200,带宽达每秒5TB。将提供多种配置。越省钱。涵盖大型语言模型、而且他们能够将所有必要的企业级模型、新平台采用的GH200可以通过英伟达的NVLink技术连接其他GH200芯片,数据中心需要有针对特殊需求的加速计算平台。它让开发者能使用自定义数据微调Hugging Face、在计算机协会(ACM)计算机图形和交互技术特别兴趣组织(SIGGRAPH)的年度大会上发表主题演讲时,并且拥有可以在整个数据中心轻松部署的服务器设计。
用黄仁勋的话来说就是:“人人都可以做到。英伟达称,这种技术让GPU能充分访问CPU内存,然后将其扩展到几乎任何数据中心、GH200将于2024年第二季度投产。投资800 万美元的新技术可以取代用旧设备建造的1亿美元设施,开发者只需点击几下即可自定义和运行生成式AI,新GH200 Grace Hopper平台的双芯片配置将内存容量提高3.5倍,
英伟达称,
黄仁勋说,公共云或者英伟达的DGX云。英伟达CEO黄仁勋将GH200称为“世界上最快的内存”。可在个人电脑(PC)或工作站上快速创建、共同部署在生成式AI的大模型上。在双芯片配置时提供合计1.2TB的快速内存。
AI Workbench为开发者提供了统一且便于使用的工具包,GH200比英伟达基于H100 的数据中心系统配备了更多内存和带宽。新的GH200 Grace Hopper 超级芯片平台提供了卓越的内存技术和带宽,以及对英伟达Omniverse软件服务的重大升级。相比前代平台,