NVIDIA利用AI来设计和开发GPU
* 来源 : * 作者 : admin * 发表时间 : 2022-07-12
NVIDIA利用AI来设计和开发GPU,最新Hopper已拥有1.3万个电路实例
在过去几年时间里,NVIDIA 深耕 AI 领域,他们的 GPU 不仅成为 HPC 的首选,也成为包括 AI 和深度学习生态系统在内的资料中心的首选。在最新公布的开发者博文中,NVIDIA 宣布正利用 AI 来设计和开发 GPU,其最新的 Hopper GPU 拥有将近 13000 个电路实例,而这些实例完全由 AI 创建。
在 NVIDIA Develope 上发布的新部落格中,该公司重申了其优势以及它自己如何利用其 AI 功能来设计其迄今为止最强大的 GPU--Hopper H100。 NVIDIA GPU 主要是使用最先进的 EDA(电子设计自动化)工具设计的,但在利用 PrefixRL 方法的 AI 的帮助下,使用深度强化学习最佳化并行首码电路,公司可以设计更小、更快、更节能的晶片,同时提供更好的性能。
Raptor 具有多项可提高可扩充性和训练速度的功能,例如作业调度、自订网路和 GPU 感知资料结构。在 PrefixRL 的上下文中,Raptor 使得跨 CPU、GPU 和 Spot 实例的混合分配工作成为可能。
这个强化学习应用程式中的网路是多种多样的,并且受益于以下几点。
Raptor 在 NCCL 之间切换以进行点对点传输以将模型参数直接从学习器 GPU 传输到推理 GPU 的能力。Redis 用于非同步和较小的消息,例如奖励或统计资讯。一种 JIT 编译的 RPC,用于处理大容量和低延迟的请求,例如上传体验资料。
NVIDIA 得出结论,将 AI 应用于现实世界的电路设计问题可以在未来带来更好的 GPU 设计。
在过去几年时间里,NVIDIA 深耕 AI 领域,他们的 GPU 不仅成为 HPC 的首选,也成为包括 AI 和深度学习生态系统在内的资料中心的首选。在最新公布的开发者博文中,NVIDIA 宣布正利用 AI 来设计和开发 GPU,其最新的 Hopper GPU 拥有将近 13000 个电路实例,而这些实例完全由 AI 创建。
在 NVIDIA Develope 上发布的新部落格中,该公司重申了其优势以及它自己如何利用其 AI 功能来设计其迄今为止最强大的 GPU--Hopper H100。 NVIDIA GPU 主要是使用最先进的 EDA(电子设计自动化)工具设计的,但在利用 PrefixRL 方法的 AI 的帮助下,使用深度强化学习最佳化并行首码电路,公司可以设计更小、更快、更节能的晶片,同时提供更好的性能。
电脑晶片中的算术电路是使用逻辑门网路(如 NAND、NOR 和 XOR)和电线构成的。
理想的电路应具有以下特点:
小:较小的区域,以便更多电路可以安装在晶片上。
快速:降低延迟以提高晶片的性能。
消耗更少的功率:晶片的功耗更低。
NVIDIA 使用这种方法设计了近 13000 个 AI 辅助电路,与同样快速且功能相同的 EDA 工具相比,它们的面积减少了 25%。但是 PrefixRL 被提到是一项运算要求非常高的任务,并且对于每个 GPU 的物理类比,它需要 256 个 CPU 和超过 32,000 个 GPU 小时。为了消除这个瓶颈,NVIDIA 开发了 Raptor,这是一个内部分散式强化学习平台,它特别利用 NVIDIA 硬体进行这种工业强化学习。
Raptor 具有多项可提高可扩充性和训练速度的功能,例如作业调度、自订网路和 GPU 感知资料结构。在 PrefixRL 的上下文中,Raptor 使得跨 CPU、GPU 和 Spot 实例的混合分配工作成为可能。
这个强化学习应用程式中的网路是多种多样的,并且受益于以下几点。
Raptor 在 NCCL 之间切换以进行点对点传输以将模型参数直接从学习器 GPU 传输到推理 GPU 的能力。Redis 用于非同步和较小的消息,例如奖励或统计资讯。一种 JIT 编译的 RPC,用于处理大容量和低延迟的请求,例如上传体验资料。
NVIDIA 得出结论,将 AI 应用于现实世界的电路设计问题可以在未来带来更好的 GPU 设计。
上一条: 南亚科总座:DRAM仍会跌价
下一条: Q2全球PC出货量年减逾15%,连两季下降