美元换人民币  当前汇率7.27

AWS推新AI实例降低使用门槛

* 来源 : * 作者 : admin * 发表时间 : 2025-08-13
亚马逊云科技(Amazon Web Services)于2025年8月12日宣布推出全新配置的P5实例,首次在高性能P5系列中引入单GPU选项,搭载英伟达H100 Tensor Core GPU,旨在为人工智能(AI)和高性能计算(HPC)工作负载提供更灵活、更具成本效益的云资源。这一举措标志着云计算服务商正进一步推动AI基础设施的精细化和普惠化。
新推出的单GPU P5实例配备高达96个vCPU和768GB系统内存,搭配具备80GB高带宽显存的H100 GPU,专为推理任务、中小规模模型微调、生成式AI原型开发等场景设计。相比传统需动用8个GPU的多卡P5实例,单GPU配置显著降低了资源门槛和使用成本。据官方信息显示,在处理轻量级任务时,用户可节省高达70%的支出,使初创团队、科研机构和中小企业能够以更经济的方式使用企业级AI算力。
此次发布首先在AWS美国东部(弗吉尼亚北部)区域全面上线,后续将逐步扩展至其他地区。这一更新顺应了当前AI算力需求激增与GPU资源紧张的行业背景。此前,AWS已在2025年6月宣布对多款NVIDIA加速实例降价最高达45%,以提升可访问性。此次推出单GPU实例,进一步体现了其优化资源分配、缓解算力短缺的战略方向。
在竞争格局上,AWS此举也与Google Cloud和Microsoft Azure等云服务商推出的分时或部分GPU实例形成对标,反映出主流云平台正共同推动算力资源的模块化与弹性化。社区开发者普遍对此表示欢迎,认为这有助于降低AI实验门槛,激发更多创新应用。
新实例与AWS生态系统深度集成,可无缝对接SageMaker等机器学习服务,支持模型训练、部署与监控全流程。分析认为,这类灵活配置将促进混合云环境下AI应用的高效迭代,推动自然语言处理、生物制药研发、智能推荐等领域的技术落地。未来,业界预期AWS或将把H200等新一代GPU引入单卡配置,持续强化其在AI云计算领域的领先地位。