在过去一年AI的风起云涌当中,英伟达是率先吃到AI发展红利的公司,股价在一年之内飙升了260%,目前市值已经突破 2.2 万亿美元。英伟达员工“靠股票致富”一度成为行业热闻,令人艳羡。(关于英伟达在中国的更多内容,可参看36氪之前报道:夹缝中的英伟达中国 | 深氪lite)
如今,英伟达技术的最新进展如何?英伟达后续将他们的GPU落地到各行各业?种种疑问,也让行业对于这场演讲更加关注。
发布历史上“最成功”GPU
此次演讲中,英伟达发布了他们的下一代芯片架构Blackwell,这一GPU平台也是黄仁勋口中,英伟达史上最成功的产品。
据介绍,Blackwell GPU以数学家David Harold Blackwell的名字命名,同样沿用了英伟达此前推出的Hopper架构。Blackwell GPU中包含2080亿个晶体管,可以支持多达10万亿个参数的AI模型。
黄仁勋展示Blackwell
除了芯片本身之外,这一架构还采用了第五代NVLink高速互联、第二代Transformer引擎,多方位全面升级。据黄仁勋介绍,这一全新的芯片将在2024年晚些时间上市。
在商业化层面,英伟达方面已经有了初步计划。黄仁勋表示,英伟达未来计划用Blackwell向世界各地的人工智能公司进军,与世界各地的所有OEM、区域云、国家主权AI、电信公司签约。
目前,亚马逊、戴尔、谷歌、Meta、微软、OpenAI、特斯拉都已经计划使用Blackwell GPU。
blackwell 参数情况
值得注意的是,此前传说中的B100并没有出现,英伟达转而发布了由一个Grace CPU、和两组Blackwell GPU组合而成的超级芯片GB200。
黄仁勋介绍, 相比于H100,「GB200」的算力是前者的6倍,而对应处理多模态特定领域的算力表现可达30倍。
此外,英伟达还发布了由36组Grace CPU和72组Blackwell GPU组合而成的服务器GB200 NVL72。
GB200 NVL72参数
在「GB200 NVL72」上,推理算力达到1440 PFLOPS,传输量最大达到每秒260TB,另外,FP8精度的训练算力就高达720PFlops,几乎相当于一个超级计算机集群。
发布机器人领域通用大模型
此次,英伟达将推出了一款用于机器人领域、名为GROOT的通用基础大模型。此外,英伟达还推出了适用于机器人的全新计算机Thor,英伟达对于相关的性能、功耗和尺寸进行了具体的优化。
GROOT
据介绍,英伟达希望通过这一举措,让机器人拥有更聪明的大脑,得以通过观察人类的行为,做出自然的模仿动作,在动作的协调性、灵活性等方面大大提升。
英伟达方面称,目前正在为1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics 和 XPENG Robotics等人形机器人公司构建AI平台。
更新25个医疗微服务
此次,英伟达还推出了全新的AI推理服务器NIM(NVIDIA INFERENCE MICROSERVICE),让所有人都可以通过这一形式自定义AI模型和应用。
在医疗场景上,英伟达此次推出了基于医疗场景的25个新的微服务(NIM), 帮助全球的医疗保健公司可以基于生成式 AI进行效率提升。
对于医疗行业公司来说,他们可以基于这些微服务,筛选数万亿种药物化合物,收集更多的患者数据以帮助早期疾病检测,或者实施更智能的数字助理等等。
具体而言,这些微服务包括一系列药物发现模型,包括用于生成化学的「MolMIM」、用于蛋白质结构预测的「ESMFold」、帮助研究人员了解药物分子如何与靶标相互作用的「DiffDock」。
医疗落地
英伟达方面举了一个例子,与在CPU上运行相比,英伟达的微服务能够将基因组分析工作流程中的变异调用速度提高了50倍以上。
英伟达还展示了另外一个在医疗领域合作的例子。有初创企业借助搭建基于人工智能驱动的医疗临床对话平台,平台将通过电话与患者交谈以安排预约、术前约访、出院随访等,将大大缓解普遍的人员短缺问题,改善患者的治疗结果,也为临床医生节省最多三个小时时间。
目前,全球有接近50家应用程序提供商正在使用英伟达的医疗微服务。
汽车落地
英伟达今日还发布了全新的「DRIVE Thor」车载计算平台。
作为上一代「DRIVE Orin」的继任者,这一平台将提供功能更丰富的自动驾驶舱性能——集成了专为Transformer、LLM和生成式AI 工作负载而设计的全新 NVIDIA Blackwell 架构。
目前,已经有多加厂商公布了这一平台的全新合作进展。
比如,比亚迪和英伟达的合作范围从汽车扩展到云。除了在DRIVE Thor上构建下一代电动汽车车队外,比亚迪还计划使用英伟达的AI基础设施进行基于云的AI开发和培训技术。
另外,广汽、小鹏汽车在内等厂商也表明了将使用「DRIVE Thor」车载计算平台。
此外,黄仁勋还披露了他们将数字建模技术用到苹果去年发布的空间计算设备Vision Pro上。在英伟达播放的一条视频短片中,英伟达着重展示了一个汽车模型在苹果设备上的应用。
Vision Pro上展示的交互应用
通信&气候治理&量子计算
此次,英伟达方面还宣布推出「6G研究云平台」。基于这一平台,通信公司可以对物理地形和人造建筑进行精确模拟,大大提高无线传输的可靠性。诺基亚、三星是这一领域的合作伙伴。
6G研究云平台
这次演讲上,英伟达还推出了「Earth-2 气候数字孪生云平台」,用来模拟和可视化天气。据介绍,Earth-2可以帮助用户在几秒钟内提供警告和更新的预报,而若采用传统的CPU驱动建模,则需要几分钟或几小时。
不仅仅是速度上有优势,用「Earth-2 气候数字孪生云平台」所生成的气候图像,分辨率比当前数值模型高12.5倍,速度快1000 倍,并且能源效率提高 3000倍,纠正了粗分辨率预测的不准确性。
黄仁勋也介绍了这一平台的实际使用场景。比如,台湾中央气象局就计划利用这一模型来预测台风登陆的更精确位置,对人员进行早期疏散,减少人员伤亡。
此次,英伟达方面还宣布,日本新型ABCI-Q超级计算机,将由英伟达加速和量子计算平台提供支持。这一超级计算机由 500多个节点中的2000 多个英伟达H100 GPU提供支持,这是世界上唯一完全可卸载的网络内计算平台,预计将于明年初部署。