【财新网】美国当地时间3月18日,在一年一度的英伟达开发者大会(GTC)首日,英伟达在发布AI芯片、硅光网络交换机、服务器、工作站等硬件新品外,还推出了首款推理模型、首款人形机器人模型、首个推理软件,并将其开源以帮助开发者开发应用。
AI芯片方面,受2024年3月推出的Blackwell架构的芯片延期交付影响,本次GTC上英伟达只推出了基于Blackwell架构的新品Blackwell Ultra,预计2025年下半年开始交付。“Blackwell正在全力生产中,进展十分惊人,因为推理模型在带动需求,”黄仁勋在开幕演讲中再次对Blackwell交付晚于预期做出回应。
随着DeepSeek出圈带动模型应用,芯片的推理能力成为英伟达的新卖点。Blackwell Ultra在推理使用的FP4计算精度下具有1.1EFLOPS的算力,而在模型训练使用的FP8的精度下具有0.36EFLOPS的算力,数值上是目前最先进的GB200 NVL72(NVL即英伟达GPU间互联协议,NVL72指支持72块GPU芯片相互连接)的1.5倍。Blackwell Ultra还升级了内存、网络等指标,推理速度更快。