华为云超节点——CloudMatrix 384 超节点发布情况
发布信息
在 2025 年 4 月 10 日举行的华为云生态大会 2025 上,华为常务董事、华为云计算 CEO 张平安公布了 AI 基础设施架构进展,推出 CloudMatrix 384 超节点,并宣布已在芜湖数据中心规模上线。
超节点特点
资源供给模式转变
华为云 CloudMatrix 384 超节点可实现从服务器级到矩阵级的资源供给模式转变,具备“高密”“高速”“高效”的特点,通过架构创新,在算力、互联带宽、内存带宽等方面实现领先。
算力提升
在算力密度上,CloudMatrix 384 超节点将传统单节点 8 卡升腾服务器,通过新型高速总线实现 384 张芯片的紧耦合互联,打造了一个超级云服务器,实现算力规模的 50 倍提升,达 300PFlops。
互联带宽提升
在互联带宽上,CloudMatrix 384 超节点通过超高带宽 Scale - Up 新型高速总线网络实现从“传统以太网”向“共享总线网络”演进,将资源互联带宽提升了 10 倍以上。公开资料显示,以上关键特性均已超越英伟达 NVL72 超节点。
相关服务优化及应用
升腾 AI 云服务
华为云对升腾 AI 云服务进行持续优化,目前其已全面适配包含 DeepSeek 在内的 160 多个第三方大模型,为大模型训推提供可靠保障,支撑行业应用快速落地。
盘古大模型
华为云盘古大模型已在 30 多个行业、400 多个场景中落地,在城市治理、智慧金融、医疗健康、气象预测等领域广泛应用。
DeepSeek - R1 上线情况
上线信息
硅基流动在 4 月 10 日宣布联合华为云基于 CloudMatrix 384 超节点升腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek - R1。
性能表现
硅基流动介绍称,该服务在保证单用户 20TPS 水平前提下,单卡 Decode 吞吐突破 1920Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在升腾算力部署 DeepSeek - R1 的模型精度与 DeepSeek 官方保持一致。
总的来说,华为云 CloudMatrix 384 超节点的推出以及 DeepSeek - R1 的上线,展示了华为在 AI 基础设施领域的强大实力和创新能力,有望为行业发展带来新的动力