华为发布新技术：降低对HBM依赖，推动AI推理性能提升

* 来源 : * 作者 : admin * 发表时间 : 2025-08-11

综合媒体报道，华为计划在8月12日举办的“2025金融AI推理应用落地与发展论坛”上发布一项突破性的AI推理技术成果。这一成果有望减少中国在AI推理领域对高带宽内存（HBM）的依赖，并显著提升国产大模型的推理性能，进一步完善本土AI推理生态系统的关键环节。
高带宽内存（HBM）作为一种基于3D堆叠技术的先进DRAM解决方案，通过多层芯片垂直集成，显著提升了数据传输效率，具备高带宽、低延迟、高容量密度和高能效等优势。由于AI推理需要频繁调用海量模型参数与实时输入数据，HBM能够让GPU直接访问完整模型，避免传统DDR因带宽不足导致算力闲置的问题，尤其适用于千亿参数级的大模型。目前，HBM在AI训练领域的渗透率接近100%，推理端也随着模型复杂化的加速而普及。
然而，HBM的产能有限，加之美国出口限制，促使国内厂商探索Chiplet封装、低参数模型优化等替代方案。当前，全球HBM市场主要由SK海力士、三星电子和美光科技主导。其中，SK海力士占据了约53%的市场份额，率先量产了HBM3E；三星电子占38%，计划到2025年将HBM供应量扩大至去年的两倍；美光科技则占据约10%的市场份额，目标是在2025年将其市占率提升至20%以上。相比之下，国内厂商如长鑫存储虽然推出了国产DDR5内存，打破了三星、SK海力士与美光的垄断，但在HBM业务上的发展仍需努力。
华为此次发布的AI推理技术成果旨在解决上述问题。据透露，这项技术能够降低中国AI推理对HBM的技术依赖，并提升国产大模型的推理性能。此前，北京联合华为发布了DeepSeek全端开源推理方案，该方案基于北京大学自研的SCOW算力平台系统和鹤思调度系统，整合了DeepSeek、openEuler、MindSpore等社区开源模块，实现了华为昇腾上的高效推理。
华为CEO任正非在今年6月接受《人民日报》专访时指出，尽管华为在芯片方面落后于美国一代，但公司通过数学补物理、非摩尔定律补充摩尔定律的方法，在结果上也能达到实用状况。他强调，通过叠加和集群等方法，计算结果可以与最先进的水平相当。
面对HBM市场的高度垄断和技术差距，华为选择了“弯道超车”的策略。通过技术创新和软件优化，华为致力于在算力和存储两个关键领域实现突破。这种策略不仅有助于减少对中国大陆企业对进口HBM的依赖，还能提升整体AI系统的性能表现。

上一条: 三星12层HBM3E或迎关键突破 8层产品面临淘汰下一条: 三星重启Z-NAND研发：瞄准AI时代超高速存储新赛道

快讯：

华为发布新技术：降低对HBM依赖，推动AI推理性能提升

业内新闻

行情日评

品牌资讯