华为OceanStor A存储,再次登顶全球AI性能榜首
* 来源 : * 作者 : admin * 发表时间 : 2025-08-08
在科技飞速发展的当下,AI领域的竞争愈发激烈,而存储技术作为AI发展的关键支撑,其重要性不言而喻。2025年8月5日,一则重磅消息在科技圈引发广泛关注:全球权威AI性能评测组织公布了最新MLPerf® Storage v2.0基准测试结果,华为OceanStor A系列存储联合济南超级计算技术研究院(JNIST)在众多强劲对手中脱颖而出,一举斩获多项全球排名第一,再次登顶单存储设备、每U存储设备及单客户端性能榜首,展现出华为在AI存储领域的强大实力与卓越技术。
MLPerf® Storage在全球AI存储性能评测领域堪称权威标杆,其以极为严格的标准化测试流程和跨厂商可比性闻名于世。此次测试吸引了来自全球的26家业界主流厂商参与角逐,其中不乏DDN、IBM、焱融、HPE、UBIX、Nutanix等专业存储领域的佼佼者,如此强大的参赛阵容充分彰显了该榜单在全球科技领域广泛的认可度与深远影响力,也让华为此次的夺冠更具含金量。
在Training场景测试中,MLPerf® Storage涵盖了3D U-Net等对存储性能要求极高的负载用例。这些用例不仅聚焦考核GPU利用率及横向扩展能力,更着重强调存储与网络的协同优化,以此全面验证存储系统对大规模AI集群算力的支撑能力。而在本次测试新增的Checkpointing场景中,作为首个测试大模型训练检查点性能的行业标准,其聚焦于存储频繁保存训练状态时的稳定性表现,能够全面覆盖大规模集群断点续训、模型存档等实际应用场景,为集群存储的选型决策提供了极为关键的参考依据。
在Training场景的激烈比拼中,华为OceanStor A系列存储以令人惊叹的实力刷新了全球记录。在3D U-Net这一对存储带宽要求近乎苛刻的训练用例测试中,华为OceanStor A系列存储展现出了绝对的性能优势。在确保GPU利用率始终保持在90%以上的严苛条件下,成功获得了单存储设备、每U存储设备及单客户端三项指标的全球第一。其中,单台8U双节点架构的OceanStor A800表现尤为亮眼,它宛如一位不知疲倦的“数据搬运工”,可轻松支撑255张H100 GPU训练数据的吞吐需求,持续稳定地提供高达698 GiB/s的带宽,这一数据不仅彰显了华为存储强大的性能,更让其在众多竞争对手中脱颖而出,成为当之无愧的性能王者。而单台2U双节点架构的OceanStor A600也毫不逊色,它能够完美支撑76张H100 GPU训练场景的吞吐需求,每U带宽稳定达到108 GiB/s,单客户端带宽达104 GiB/s,以出色的表现证明了华为存储在不同规格产品上的卓越性能。
在新增的Checkpointing工作负载测试中,华为OceanStor A系列存储同样展现出了碾压对手的实力。在Llama3_8b模型训练场景下(单台8卡训练服务器8并发场景),华为OceanStor A系统存储单客户端如同高速行驶的列车,支持40.2 GiB/s的读带宽与20.5 GiB/s的写带宽,凭借如此出色的性能,成功排名第一。而在Llama3_70b模型训练场景下(单台8卡训练服务器8并发场景),华为OceanStor A系统存储单客户端更是一骑绝尘,以68.8 GiB/s的读带宽与62.4 GiB/s的写带宽,领先第二名高达6.7倍,再次强势夺冠,充分证明了华为存储在Checkpointing场景下的绝对优势。
MLPerf® Storage在全球AI存储性能评测领域堪称权威标杆,其以极为严格的标准化测试流程和跨厂商可比性闻名于世。此次测试吸引了来自全球的26家业界主流厂商参与角逐,其中不乏DDN、IBM、焱融、HPE、UBIX、Nutanix等专业存储领域的佼佼者,如此强大的参赛阵容充分彰显了该榜单在全球科技领域广泛的认可度与深远影响力,也让华为此次的夺冠更具含金量。
在Training场景测试中,MLPerf® Storage涵盖了3D U-Net等对存储性能要求极高的负载用例。这些用例不仅聚焦考核GPU利用率及横向扩展能力,更着重强调存储与网络的协同优化,以此全面验证存储系统对大规模AI集群算力的支撑能力。而在本次测试新增的Checkpointing场景中,作为首个测试大模型训练检查点性能的行业标准,其聚焦于存储频繁保存训练状态时的稳定性表现,能够全面覆盖大规模集群断点续训、模型存档等实际应用场景,为集群存储的选型决策提供了极为关键的参考依据。
在Training场景的激烈比拼中,华为OceanStor A系列存储以令人惊叹的实力刷新了全球记录。在3D U-Net这一对存储带宽要求近乎苛刻的训练用例测试中,华为OceanStor A系列存储展现出了绝对的性能优势。在确保GPU利用率始终保持在90%以上的严苛条件下,成功获得了单存储设备、每U存储设备及单客户端三项指标的全球第一。其中,单台8U双节点架构的OceanStor A800表现尤为亮眼,它宛如一位不知疲倦的“数据搬运工”,可轻松支撑255张H100 GPU训练数据的吞吐需求,持续稳定地提供高达698 GiB/s的带宽,这一数据不仅彰显了华为存储强大的性能,更让其在众多竞争对手中脱颖而出,成为当之无愧的性能王者。而单台2U双节点架构的OceanStor A600也毫不逊色,它能够完美支撑76张H100 GPU训练场景的吞吐需求,每U带宽稳定达到108 GiB/s,单客户端带宽达104 GiB/s,以出色的表现证明了华为存储在不同规格产品上的卓越性能。
在新增的Checkpointing工作负载测试中,华为OceanStor A系列存储同样展现出了碾压对手的实力。在Llama3_8b模型训练场景下(单台8卡训练服务器8并发场景),华为OceanStor A系统存储单客户端如同高速行驶的列车,支持40.2 GiB/s的读带宽与20.5 GiB/s的写带宽,凭借如此出色的性能,成功排名第一。而在Llama3_70b模型训练场景下(单台8卡训练服务器8并发场景),华为OceanStor A系统存储单客户端更是一骑绝尘,以68.8 GiB/s的读带宽与62.4 GiB/s的写带宽,领先第二名高达6.7倍,再次强势夺冠,充分证明了华为存储在Checkpointing场景下的绝对优势。
华为OceanStor A系列存储之所以能够在如此权威且竞争激烈的测试中屡获佳绩,持续创新是其制胜的法宝。面对未来更强大的GPU卡,华为OceanStor A系列存储展现出了强大的扩展性,其性能可随着客户端与存储节点数量的增加而实现线性增长,能够轻松提供百TB级的稳定集群带宽,为大规模训练提供了坚如磐石的数据访问能力,如同为AI集群搭建了一条高速、稳定的数据高速公路。同时,华为OceanStor A系列存储在多维度展开了全方位的技术创新:
- 高扩展性:其集群如同一个可无限扩展的“数据仓库”,支持EB级容量的横向扩展,轻松应对海量数据存储需求;每个引擎更是具备强大的扩展能力,可支持多GPU、DPU或NPU纵向扩展,最大支持扩容至4096张算力卡,为不同规模的AI应用提供了灵活的扩展方案。
- 数据韧性:华为通过架构创新,为数据打造了坚不可摧的“防护盾”,实现了99.999%的高可靠性,让数据安全得到了全方位保障。同时,内置的防勒索引擎如同一位忠诚的“卫士”,能够将侦测准确率提升至99.99%,有效抵御各种潜在的数据威胁。
- 全新数据范式:构建PB级KV Cache全局共享资源池,这一创新举措如同为数据搭建了一个高效的“中转站”,在保证推理精度的同时,将首token时延(TTFT)降低90%,推理吞吐实现10倍提升,极大地提升了客户的推理体验。此外,内置的RAG知识库更是为用户提供了强大的支持,它支持标量、向量、张量、图等多模式检索,如同一个智能化的“数据导航仪”,大幅度降低了AI大模型的使用门槛,让更多用户能够轻松驾驭AI技术。
- 数据编织:基于强大的存储元数据管理及检索能力,华为实现了全局数据的可视、可管,让数据管理变得更加直观、高效。通过这一创新,可实现10倍的数据流动效率提升,让数据在不同应用场景中能够快速、准确地流通,充分发挥数据的价值。
- 绿色节能:华为始终秉持绿色发展理念,通过存储介质应用创新和整机硬件创新,推出了128TB大容量SSD盘,其密度高达1PB/U,能耗低至0.7Watt/TB,如同为数据中心安装了一个高效的“节能器”,在降低能耗的同时,提高了存储密度,为可持续发展贡献了华为力量。






关闭返回