美元换人民币  当前汇率7.27

华为发布新技术:降低对HBM依赖,推动AI推理性能提升

* 来源 : * 作者 : admin * 发表时间 : 2025-08-11
综合媒体报道,华为计划在8月12日举办的“2025金融AI推理应用落地与发展论坛”上发布一项突破性的AI推理技术成果。这一成果有望减少中国在AI推理领域对高带宽内存(HBM)的依赖,并显著提升国产大模型的推理性能,进一步完善本土AI推理生态系统的关键环节。
高带宽内存(HBM)作为一种基于3D堆叠技术的先进DRAM解决方案,通过多层芯片垂直集成,显著提升了数据传输效率,具备高带宽、低延迟、高容量密度和高能效等优势。由于AI推理需要频繁调用海量模型参数与实时输入数据,HBM能够让GPU直接访问完整模型,避免传统DDR因带宽不足导致算力闲置的问题,尤其适用于千亿参数级的大模型。目前,HBM在AI训练领域的渗透率接近100%,推理端也随着模型复杂化的加速而普及。
然而,HBM的产能有限,加之美国出口限制,促使国内厂商探索Chiplet封装、低参数模型优化等替代方案。当前,全球HBM市场主要由SK海力士、三星电子和美光科技主导。其中,SK海力士占据了约53%的市场份额,率先量产了HBM3E;三星电子占38%,计划到2025年将HBM供应量扩大至去年的两倍;美光科技则占据约10%的市场份额,目标是在2025年将其市占率提升至20%以上。相比之下,国内厂商如长鑫存储虽然推出了国产DDR5内存,打破了三星、SK海力士与美光的垄断,但在HBM业务上的发展仍需努力。
华为此次发布的AI推理技术成果旨在解决上述问题。据透露,这项技术能够降低中国AI推理对HBM的技术依赖,并提升国产大模型的推理性能。此前,北京联合华为发布了DeepSeek全端开源推理方案,该方案基于北京大学自研的SCOW算力平台系统和鹤思调度系统,整合了DeepSeek、openEuler、MindSpore等社区开源模块,实现了华为昇腾上的高效推理。
华为CEO任正非在今年6月接受《人民日报》专访时指出,尽管华为在芯片方面落后于美国一代,但公司通过数学补物理、非摩尔定律补充摩尔定律的方法,在结果上也能达到实用状况。他强调,通过叠加和集群等方法,计算结果可以与最先进的水平相当。
面对HBM市场的高度垄断和技术差距,华为选择了“弯道超车”的策略。通过技术创新和软件优化,华为致力于在算力和存储两个关键领域实现突破。这种策略不仅有助于减少对中国大陆企业对进口HBM的依赖,还能提升整体AI系统的性能表现。