AMD 周一推出了最新一代数据中心 GPU Instinct MI200 加速器。 该芯片制造商表示,它是最快的 HPC 和 AI 加速器,超过了去年推出的 MI100 创下的记录。
AMD 表示,与现有数据中心 GPU 相比,Instinct MI200 在高性能计算方面的提升高达 4.9 倍。 该公司还声称它是最快的 AI 训练,为混合精度性能提供高达 1.2 倍的峰值触发器。
该加速器包含 580 亿个采用 6nm 技术生产的晶体管。 这允许多达 220 个计算单元,与 MI100 相比,计算密度提高了 80% 以上。 它也是世界上第一个具有 128GB HBM2E 显存的 GPU。
它是世界上第一款多芯片 GPU,采用 AMD 第二代 CDNA 架构。 AMD 去年在将其数据中心和游戏 GPU 设计分叉时推出了 CDNA 架构。 CDNA 架构专为优化数据中心计算工作负载而设计。
AMD 负责数据中心 GPU 加速器的副总裁 Brad McCreadie 上周告诉记者:“当然,这些工作负载在非常不同的系统上运行,因此将它们分成两种产品和两个芯片系列是我们设计更好产品的一种简单方法。” .
新的 MI200 加速器在 FP64 峰值性能方面比 Nvidia 的 A100 GPU 快大约 5 倍。 这对于需要高精度的 HPC 工作负载(如天气预报)来说至关重要。 其峰值 FP32 矢量性能大约快 2.5 倍。 AMD 指出,这对于用于疫苗模拟的数学运算类型很重要。
AMD 还推出了其首款采用 3D Chiplet 技术的服务器 CPU Milan-X。 它将于 2024 年第一季度正式推出。
与标准 Milan 处理器相比,这些处理器具有 3 倍的 L3 缓存。 在米兰,每个 CCD 有 32MB 的缓存。 在 Milan-X 中,AMD 为每个 CCD 带来了 96MB。 CPU 在堆栈顶部的每个插槽总共有 804 MB 的缓存,减轻了内存带宽压力并减少了延迟。 这反过来又大大加快了应用程序的性能。
在插槽级别,Milan-X 是处理技术计算工作负载速度最快的服务器处理器,与 Milan 相比,目标技术计算工作负载的性能提升超过 50%。
AMD 专注于一些支持产品设计的工作负载,例如用于模拟和优化芯片设计的 EDA 工具。 大型缓存对于为这些工作负载获得更好的性能至关重要。
在芯片设计中,验证是最重要的工作之一。 它有助于在芯片被烘烤成硅之前尽早发现缺陷。 与 Milan 相比,Milan-X 在给定时间内多完成了 66% 的工作。 这应该可以帮助使用 EDA 工具的客户更快地完成验证并进入市场,或者在相同的时间内添加更多测试,以进一步提高其设计的质量或稳健性。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66571.html