AMD 第五代EPYC服务器DDR5内存带宽测试 & 调优对比

概述

搭载最新第五代 AMD EPYC 处理器的戴尔科技 PowerEdge 服务器,引领全新服务器技术。这些第 17 代主流机架式戴尔 PowerEdge 服务器提供单路和双路版本,以及 1U 和 2U 两种规格。 

在双插槽系统(例如 R7725)上,每个插槽提供 12 个 DIMM 通道,速度高达 6,400 MT/s。第五代 EPYC 的单插槽机型也提供 12 个内存通道,每个通道两个 DIMM,因此可安装 24 个 DIMM。单插槽 R7715 在每个通道安装一个 DIMM 时可提供 5,200 MT/s 的速度,在每个通道安装两个 DIMM 时可提供 4,400 MT/s 的速度。 

本文档将这些具有不同内存数量的新服务器测得的内存带宽读数与运行第四代 AMD EPYC 处理器的上一代服务器进行了比较。 

第五代 AMD EPYC 内存架构

第五代 AMD EPYC 处理器基于 AMD 的 DDR5 内存支持,该功能首次应用于上一代内存控制器。其采用Chiplet设计,中央 I/O 芯片组周围环绕着计算芯片组,内存运行速度最高达 6,400 MT/s,比上一代第四代 AMD EPYC 处理器支持的 4,800 MT/s 速度提升了 30% 以上。

尽管速度有所提升,但 Dell PowerEdge R7725 和 R7715 主流第五代 AMD EPYC 处理器仍保留与 AMD 第四代 PowerEdge 产品相同的内存拓扑。

内存带宽测试

STREAM 内存测试是一项综合基准测试,旨在测量可持续内存带宽,即在实际条件下数据进出内存的速率。它广泛应用于高性能计算 (HPC)、人工智能和机器学习环境,而内存带宽通常是这些环境中的限制因素。STREAM 测试评估系统处理大数据传输的效率,这对于处理大型数据集的工作负载至关重要。

首先,我们测试了 PowerEdge R7725 的内存性能。这些数据来自不同内存通道的测试,64GB DIMM 内存的最高运行频率为 6,400 MT/s。

此处显示的数据是在 BIOS 出厂默认配置和调整后的 BIOS 设置下收集的。测试了以下系统:

  • 上一代 Dell PowerEdge R7625,搭载 AMD 第四代 EPYC CPU,每通道最多可容纳 12 个 DDR5 4,800 MT/s DIMM
  • 最新一代 Dell PowerEdge R7725,搭载 AMD 第五代 EPYC CPU,每个插槽最多可容纳 12 个 DDR5 6,400 MT/s DIMM

图 1.采用默认 BIOS 设置的基于第五代 AMD EPYC 处理器的 PowerEdge 服务器的系统聚合内存带宽趋势与 DIMM 数量(6400MT/s,测试集为Stream-Triad——以下同)

注:参考以上测试结果,每插槽12个DIMM的EPYC 5服务器,推荐成对安装或增加内存(每条内存规格最好也相同),在插满12条时可达最高内存带宽性能(双CPU机型就是24个DIMM)。如果是单数的Unbalanced内存配置,特别是在每CPU插槽7、9、11情况下性能不理想。

图 2.针对基于第五代 AMD EPYC 处理器的 PowerEdge 服务器,在调整 BIOS 设置后,系统聚合内存带宽趋势与 DIMM 数量的关系(6400MT/s)

扩展阅读:《AMD EPYC 9005服务器BIOS & 工作负载调优指南
注:参考上面图表,在进行BIOS设置调优之后,并不是所有的内存通道插法在Stream测试中都有提高,但每CPU插槽2、4、8、12这几种Near-Balanced和Balance配置都能看到增益。

图 3.针对基于第四代 AMD EPYC 处理器的 PowerEdge 服务器,在调整 BIOS 设置后,系统聚合内存带宽趋势与 DIMM 数量的关系 (4800MT/s)

在双路平台上,这些结果表明,在内存满配或均衡配置的情况下,性能较上一代(6400MT/s vs. 4800MT/s)提升了12.6%。在接近均衡的配置下,性能较第四代EPYC(霄龙)平均提升了近19% 。这一性能水平有助于提升客户对戴尔PowerEdge服务器解决方案日益增长的系统性能期望。  

接下来,我们来看看单CPU插槽 Dell PowerEdge R7715 上的相同数据。请注意,不支持 15、14 和 13 条 DIMM 配置,因此没有提供这些配置的数据。

图 4.采用默认 BIOS 设置的基于第五代 AMD EPYC 处理器的 PowerEdge 服务器的系统聚合内存带宽趋势与 DIMM 数量(5200MT/s - 右侧1 DPC、4400MT/s - 左侧2 DPC)

注:根据上面测试结果,我们还是建议尽量避免单数(非均衡)内存配置。当内存数量不超过12时,由于主板上每个通道都有2个DIMM插槽,为确保信号质量只插1 DPC时的内存频率是5200MT/s。而一旦超过12条内存就是2 DPC配置,速率会降到4400MT/s,所以会看到单CPU 24条满插时带宽比12条要低。

图 5.针对基于第五代 AMD EPYC 处理器的 PowerEdge 服务器,在调整 BIOS 设置后,系统聚合内存带宽趋势与 DIMM 数量的关系(5200MT/s - 右侧1 DPC、4400MT/s - 左侧2 DPC)

注:当优化BIOS配置后,除了在满配24个DIMM时内存带宽有提升之外(12 DIMM略有下降),我看到在2、4、8,以及16及以上DIMM数量的Near Balanced配置下也都是获益的在单插槽配置中,BIOS 优化使非平衡配置(19、21、23个DIMM)的性能提升超过 100%,在这项内存带宽工作负载中,其性能与平衡配置几乎持平。 

关键要点

这些数据体现了 DDR5 内存技术的持续演进,以及戴尔在 AMD 世界一流处理器平台方面的专业技术。无论您为搭载戴尔 AMD 第五代处理器的机架式解决方案选择哪种内存配置,其性能都不会令人失望。  

服务器配置

服务器型号

中央处理器

PowerEdge R7725

AMD EPYC 9555

PowerEdge R7715

AMD EPYC 9655P

PowerEdge R7625

AMD EPYC 9654

戴尔科技集团于 2025 年 3 月进行了测试,测试对象包括搭载第五代 AMD CPU 9555 的 PowerEdge R7725和搭载第五代 AMD CPU 9655P的 Dell PowerEdge R7715。PowerEdge R7625 的性能数据采用历史数据。此数据由戴尔科技集团于 2023 年 1 月收集。具体结果可能有所不同。