8月8日晚,英伟达创始人兼CEO黄仁勋在计算机图形界顶级会议SIGGRAPH上发表主题演讲,并且宣布推出新一代GH200 Grace Hopper超级芯片及相应平台。
黄仁勋在演讲中甚至说到,“生成式 AI 时代和 AI 的 iphone 时刻已经到来”。
那么英伟达这次带来的新品到底有多强呢?
新一代的GH200 Grace Hopper平台是专为处理大语言模型、推荐系统、矢量数据库等全球最复杂的生成式 AI 工作负载而构建。
平台采用双配置,提供的内存容量和带宽比当前产品分别增加 3.5 倍和 3 倍,包括一个拥有 144 个 Arm Neoverse 内核、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 内存技术的单个服务器。新平台可以通过 Nvidia NVLink™ 与其他超级芯片连接,从而实现协同工作,部署当下大型生成式 AI 模型。该技术使 GPU 可以完全访问 CPU 内存,在双配置中可提供总计 1.2TB 的快速内存。黄仁勋表示,一台服务器可以同时装载两个GH200超级芯片,大型语言模型的推理成本将会大幅降低。
到底有多夸张呢?
投资800万美元Grace Hopper,就相当于8800个价值1亿美元的x86 GPU,意味着成本降低12倍,能耗降低20倍。
除此之外,英伟达还发布了AI Workbench。
其能够为开发者提供一个统一、易用的工作空间,使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,并将这些模型扩展到几乎所有数据中心、公有云或DGX Cloud。
另外,英伟达在会上还发布了3款适用于台式工作站的GPU,分别是RTX 5000、RTX 4500和RTX 4000,可以为可扩展开放式3D世界生态系统通用场景描述提供加速。
最后,基于GH200 Grace Hopper平台的新系统将于2024年第二季度投产。
毫无疑问,英伟达最新芯片的推出将对于AI来说又是一支强心剂,对于大模型的效率和成本能带来明显改观。同时,也将继续巩固英伟达在AI领域的地位。
不久前的6月份,AMD发布大模型专用芯片Insight MI300X,显示出在AI领域的实力。但此时此刻,也许压力又来到了AMD这边。
就问AMD,怕不怕?