
2025年5月23日,在备受珍贵标鲲鹏昇腾树立者大会2025—昇腾AI树立者峰会上,华为重磅推出昇腾超节点技巧,得手兑现业界最大限度的384卡高速总线互联,为东谈主工智能鸿沟带来全新变革,细腻开启AI新纪元。

面前,大模子发展呈现参数与效果轮换演进的态势。一方面,ScalingLaw握住激动模子才调突破极限;另一方面,以DeepSeek为代表的改进架构与工程技巧,正加快模子才调在千行万业的落地利用。在此布景下,MoE成为主流模子结构,其复杂的羼杂并行战略带来弘大挑战,TP、SP、EP单次通讯量高达GB级且难以笼罩。跟着并行限度捏续扩大,传统工作器跨机带宽已成为巡视的中枢进犯,亟需贪图架构的改进升级以适配异日模子发展。
传统工作器依赖以太网罗兑现跨机互联,通讯带宽较低。实施标明,当TP、SP或EP等漫衍式战略的羼杂并行域超越8卡时,跨机通讯带宽便成为性能瓶颈,导致系统性能大幅着落。
华为昇腾超节点冲破了以CPU为中心的冯诺依曼架构,改进冷漠了平等贪图架构,凭借高速总线互联技巧兑现要紧突破,把总线从工作器里面,扩张到整机柜、以致跨机柜。在超节点范围内,用高速总线互联替代传统以太,通讯带宽普及了15倍;单跳通讯时延也从2微秒作念到200纳秒,裁减了10倍,使集群如归拢台贪图机般协同责任,有用突破系统性能死心。
这次推出的昇腾384超节点,由12个贪图柜和4个总线柜组成,是现在业界限度最大的超节点。依托华为在ICT鸿沟深厚的技巧与工程训戒,通过最好负载平衡组网决策,该超节点可进一步扩张为包含数万卡的Atlas900 SuperCluster超节点集群,为异日更大限度的模子演进提供有劲撑捏。
性能测试数据表露,在昇腾超节点集群上,LLaMA3等千亿喜悦模子性能比较传统集群普及2.5倍以上;在通讯需求更高的Qwen、DeepSeek等多模态、MoE模子上,性能普及可达3倍以上,较业界其他集群越过1.2倍,在行业中处于源流地位。
华为默示,异日将捏续加大改进力度,联袂公共树立者在昇腾社区共同构建智能时期高效算力底座,为千行万业的大模子改进提供坚毅能源体育游戏app平台,激动东谈主工智能技巧在更多鸿沟的深度利用与发展。
声明:新浪网独家稿件,未经授权不容转载。 -->