算力新王炸:华为Atlas 350亮相,性能碾压英伟达特供版
* 来源 : * 作者 : admin * 发表时间 : 2026-03-22
在3月21日举行的华为中国合作伙伴大会2026上,华为正式推出了搭载升腾950PR(Ascend 950PR)处理器的AI训练推理加速卡——Atlas 350。这款产品的问世,标志着中国在高端AI算力领域取得了突破性进展。
据华为升腾计算业务总裁张迪煊介绍,Atlas 350的单卡算力达到英伟达H20的2.87倍,是目前中国唯一支持FP4低精度格式的推理产品。其核心参数令人瞩目:
算力性能:FP4精度算力高达1.56 PFLOPS,是H20的1.5倍。互联带宽:达到1.4TB/s,大幅提升数据传输效率。存储配置:采用华为自研高带宽存储器(HBM),容量达112GB,为H20的1.16倍,多模态生成速度提升60%。能效表现:功耗控制在600W,实现了性能与能耗的优异平衡。图片技术层面,升腾950PR通过将内存存取颗粒度从512字节缩减至128字节,使小算子存取效率提升了4倍。新增的FP4低精度格式支持,使得整合该卡的服务器能够处理更大规模的模型,并实现更低延迟的推理。精度的降低不仅加快了计算速度,也显著提升了暂存器效率。
华为副总裁马海旭宣布,基于Atlas 350等产品,华为将构建大、中、小三大算力场景,旨在协助合作伙伴满足不同行业差异化的智能化需求,推动人工智能在各领域的落地应用。
据华为升腾计算业务总裁张迪煊介绍,Atlas 350的单卡算力达到英伟达H20的2.87倍,是目前中国唯一支持FP4低精度格式的推理产品。其核心参数令人瞩目:
算力性能:FP4精度算力高达1.56 PFLOPS,是H20的1.5倍。互联带宽:达到1.4TB/s,大幅提升数据传输效率。存储配置:采用华为自研高带宽存储器(HBM),容量达112GB,为H20的1.16倍,多模态生成速度提升60%。能效表现:功耗控制在600W,实现了性能与能耗的优异平衡。图片技术层面,升腾950PR通过将内存存取颗粒度从512字节缩减至128字节,使小算子存取效率提升了4倍。新增的FP4低精度格式支持,使得整合该卡的服务器能够处理更大规模的模型,并实现更低延迟的推理。精度的降低不仅加快了计算速度,也显著提升了暂存器效率。
华为副总裁马海旭宣布,基于Atlas 350等产品,华为将构建大、中、小三大算力场景,旨在协助合作伙伴满足不同行业差异化的智能化需求,推动人工智能在各领域的落地应用。






关闭返回