美元换人民币  当前汇率7.27

Meta和英伟达正合作将GPU核心嵌入下一代HBM内存中

* 来源 : * 作者 : admin * 发表时间 : 2025-12-01
人工智能算力竞赛正催生硬件架构的革命性变革。据行业消息,Meta与英伟达正联合评估一项颠覆性技术:将GPU核心直接嵌入高带宽存储器(HBM)的基底晶粒(Base Die)中,打造“计算-存储一体化”的定制化HBM芯片。这一设计旨在彻底打破传统AI芯片中逻辑单元与内存分离所带来的“内存墙”瓶颈,通过在内存内部执行部分计算任务,显著降低数据搬运延迟与能耗,从而提升整体能效比。SK海力士与三星作为全球HBM主要供应商,已参与早期技术讨论,预示着AI芯片、存储器厂商与云服务商三方深度协同的新时代正在开启。
当前,HBM4即将量产,HBM4E也在开发中,其带宽已突破1.2 TB/s。然而,随着英伟达Rubin Ultra与AMD MI450X等新一代AI GPU单卡功耗逼近2300瓦,散热与供电成为系统设计的极限挑战。将轻量级GPU核心集成至HBM基底晶粒,虽无法替代主GPU的复杂运算,却可在数据预处理、激活函数计算等环节分担负载,减少主芯片与内存间的数据往返。例如,在大模型推理中,注意力机制的矩阵乘法可部分卸载至HBM内部完成,从而降低主GPU的带宽压力与功耗。这种“异构近存计算”模式,有望成为继Chiplet之后的又一关键技术拐点。
然而,该技术面临多重工程难题。首先,HBM堆叠结构依赖硅通孔(TSV)连接,可用面积极为有限,难以容纳复杂逻辑电路;其次,基底晶粒内部集成运算单元将产生额外热量,而HBM本身散热条件较差,可能引发热失控;再者,供电网络需重新设计以满足动态负载变化。因此,该方案短期内更可能以“智能控制器”形式先行落地——即在HBM4中集成可编程内存管理单元,而非完整GPU核心。台积电凭借其CoWoS先进封装生态,将在该领域占据主导地位,而三星与英特尔亦在积极布局。可以预见,未来AI芯片的竞争,将不仅是晶体管密度的比拼,更是系统级集成与软硬协同优化的综合较量。