内存

创下 STAC-A2 测试新纪录,MRDIMM 助力金融风险分析业务规模化拓展

Sujit Somandepalli(美光)| Kevin Gildea(英特尔,嘉宾)| Joe Fuchs(HPE,嘉宾)

黑色背景上带有光晕效果的数字化图表。

金融服务机构始终面临一项严峻挑战:以更低功耗、更少机架空间,更快完成海量风险数据计算。从前台衍生品定价到日终风险价值核算,计算任务持续不间断,高效作业的需求也愈发迫切。

随着这些工作负载的扩展,瓶颈从计算能力转向数据传输。蒙特卡洛模拟持续传输大型数据集,这使得内存带宽成为决定吞吐量和延迟的核心要素。

一项经 STAC-A2™ 审计的新基准测试成绩,印证了内存带宽与处理器技术融合带来的性能突破。HPE ProLiant XD230 1U 服务器 (hpe.com),搭载英特尔® 至强® 6980P 处理器 (intel.com) 并配备美光® 8800 MT/s DDR5 MRDIMM (micron.com),在标准问题规模冷启动测试中创下 STAC-A2 性能新纪录,实现了迄今为止经审计的 STAC-A2 结果中报告的至高性能。

测试结果是通过经英特尔优化的 STAC-A2 实现版本生成的。STAC-A2 允许厂商针对性调优,所有测试结果均经过独立审计,保障评测标准统一。

什么是 STAC-A2?

STAC-A2 是金融市场风险分析领域的技术基准标准。该标准由多家大型银行的量化分析师与技术专家联合制定,用于评测技术栈执行期权希腊值蒙特卡洛估值的速度与效率。这类敏感度计算结果是衍生品定价、对冲交易及监管资本核算的核心依据。

为何 STAC-A2 在高带宽内存领域如此重要

这类工作负载大规模并行,对内存带宽需求极高,并深度嵌入每家主要交易机构的日常运营之中。当银行对数千个头寸运行日终风险周期时,即使是吞吐量和延迟上的微小改进,也可大幅缩减批量处理耗时。每一秒都至关重要。

STAC-A2 反映实际的量化工作负载,使其成为整个金融服务行业进行同类可比技术评估的可靠框架。

创下优异测试成绩

HPE 在其实验室中开展的 STAC-A2 测试,在所有经过 STAC-A2 审计和测试的服务器中,实现了最高的吞吐量、能源效率和空间效率。完整报告结果详见下方链接。

基准测试项结果衡量指标
投资组合吞吐量100.8 个期权/秒每秒对投资组合中的期权进行定价的数量
能源效率231,271 个期权/kWh每消耗一千瓦时电力所定价的期权数量
空间效率133.8 个期权/小时/立方英寸每小时每立方英寸服务器空间所定价的期权数量
基准希腊值(冷启动)0.033 秒标准问题规模下全部希腊值计算耗时
最大资产数量16010 分钟内可完成计算的最大资产数量(25,000 条路径,252 个时间步长)
最大路径数1,000,00010 分钟内完成的最大路径数量(5 项资产,252 个时间步长)
STAC-A2 投资组合吞吐量——代际对比图(显示至强 6980P + 美光 MRDIMM 组合达到 100.8 个期权/秒) 图 1:STAC-A2 投资组合吞吐量——代际对比

(点击图片放大)

吞吐量较上一代提升 2.38 倍

与上一代平台(搭载英特尔至强铂金 8592+ 处理器)相比,测试结果显示,该解决方案在各项关键指标上均实现了显著提升:

  • 投资组合吞吐量提升 2.38 倍
  • 标准问题规模下冷/热启动运行速度分别提升 10.42 倍/1.62 倍
  • 大规模问题规模下冷/热启动运行速度分别提升 2.04 倍/2.07 倍
  • 能效提升 1.58 倍
  • 空间效率提升 3.26 倍

这些成果实现了代际飞跃,有助于金融机构整合计算基础设施、减少数据中心占地面积,并加快从数据到洞察的转化速度。

在相同至强 6980P 处理器上,美光 MRDIMM 与 RDIMM 相比的性能提升倍数对比图 图 2:美光 MRDIMM 性能影响——配置美光 MRDIMM 与未配置 MRDIMM(相同至强 6980P)

(点击图片放大)

美光 MRDIMM:数字背后的内存优势

此次优异基准测试结果的核心,是一套能够匹配 256 个高性能核心运行的内存子系统:配备 24 条 64GB 美光 8800 MT/s DDR5 MRDIMM,每个插槽通过 12 个通道提供高达 1.5TB 的系统内存。

蒙特卡洛风险工作负载本身对内存带宽高度敏感。路径生成、相关性计算和回归步骤在每个时间步都会通过内存层级移动大量数据。

美光多路复用列 DIMM (MRDIMM) 的速度可达 8800 MT/s,与行业标准的 RDIMM 相比,在相同容量下实现更高的带宽,这使其成为 STAC-A2 测试中所观测到的吞吐量和延迟结果的重要贡献因素。

与采用 RDIMM 的同类配置至强 6980P 平台相比,测试结果显示,这套配备 MRDIMM 的方案表现如下:

  • 投资组合吞吐量提升 1.08 倍(100.8 对比 93.2 个期权/秒)
  • 大规模问题规模下希腊值计算速度提升至高 23%
  • 能源效率提升 1.29 倍(231,271 对比 178,172 个期权/kWh)
  • 空间效率提升 1.65 倍(133.8 对比 80.7 个期权/小时/立方英寸)

对于正在为计算密集型金融工作负载评估内存技术的数据中心架构师而言,结论显而易见:更高的内存带宽可直接转化为更快的风险计算速度和更高效的基础设施。

英特尔至强 6980P:为金融工作负载而生的 128 核处理器

搭载性能核心的英特尔® 至强® 6980P 处理器专为金融风险分析这类并行、计算密集型工作负载而设计。单插槽最高拥有 128 个核心,三级缓存容量达 504MB。英特尔高级矢量扩展 512 (Intel AVX-512) 能够加速作为蒙特卡洛模拟核心的矢量数学运算。

英特尔开发 STAC-A2 实现方案已有超过十年的历史,最早适配机型为英特尔 Composer XE 和至强 E5-2690 处理器。本次测试采用适用于 oneAPI(R 版)的 STAC-A2 套件,搭配英特尔 oneAPI Base Toolkit 2025.3 和 HPC Toolkit 2025.3,所取得的成果凸显了半导体技术演进中的持续创新能力。

STAC-A2 效率对比图:跨代能源效率与空间效率对比 图 3:STAC-A2 效率——跨代能效与空间效率对比

(点击图片放大)

液冷与 1U 密度兼备:高效节能表现出众

在 HPE ProLiant XD230 的 1U 机箱内,以实际生产工作负载运行双路 128 核处理器,对散热管控提出严苛技术要求。在此配置中,英特尔至强 6980P 处理器通过冷却液分配单元 (CDU) 进行液冷散热,而 CDU 本身则通过数据中心主水循环系统降温。

这种将 CPU 液冷与周边组件风冷相结合的方式,使得 HPE ProLiant Compute XD230 能够以极小机架空间实现极致计算密度,同时预留充足散热余量,保障高性能稳定持续运行。

效率结果充分说明了这一方案的价值:

  • 能源效率比同风冷配置至强 6980P 提升 1.23 倍 (INTC250422)
  • 每千瓦时处理 231,271 个期权——在所有经测试的英特尔至强 6 解决方案中能源效率最高
  • 每立方英寸每小时处理 133.8 个期权——空间效率比次优的至强 6980P 结果高出 65.8%

对于机房电力配额受限或已承诺实现可持续发展目标的机构而言,这种液冷搭配高带宽美光 MRDIMM 内存的组合具备实际运营优势:可在现有基础设施限制条件下,提升单位能耗的有效计算能力。

STAC-A2 希腊值计算速度表显示,不同平台在标准问题规模和大规模问题模式下的冷启动表现 图 4:STAC-A2 希腊值计算速度——跨平台冷启动性能对比

(点击图片放大)

希腊值计算速度

除了吞吐量和效率,原始计算速度决定了风险团队获取答案的快慢。搭载美光 MRDIMM 的 HPE ProLiant XD230 在标准问题规模和大规模问题规模下,均创下冷启动希腊值计算最快纪录。

对金融数据中心的实际价值

银行和交易机构在部署基础设施时面临着实际限制:无法扩容的电力功耗上限、固定机架配额的主机托管合同,以及对风险计算周转速度要求越来越高的监管时限。

本次 STAC-A2 测试表明,美光 MRDIMM 内存技术、英特尔至强 6 处理器,搭配 HPE XD230 液冷 1U 平台,可同时解决上述三大难题:

单次计算功耗更低:能源效率比上一代提升高达 1.58 倍,意味着机构可以在现有功耗限额内处理更多的风险计算任务,同时支持可持续发展承诺。

计算吞吐量更强:吞吐量比上一代提升高达 2.38 倍,意味着日终风险计算能够更快完成,释放出更多算力用于额外的情景分析和压力测试。

计算密度更高:空间效率提升高达 3.26 倍,意味着金融机构可以在现有数据中心空间内扩展风险分析能力,从而有可能免去高额机房扩建成本。

无论是一家全球性银行需要缩短全行范围的风险汇总时间,还是一家区域性机构希望在不扩大基础设施的前提下扩展量化风险覆盖范围,亦或是一家多元化企业需要从共享计算平台为更多内部用户提供服务,这一解决方案都能同时满足这些目标。

合作久经考验,实力持续积淀

本次测试成果源自整个生态系统内的工程协作。英特尔开发了适用于 oneAPI(R 版)的 STAC-A2 套件,并针对至强 6980P 架构进行了优化;美光提供了 8800 MT/s DDR5 MRDIMM,其具备的内存带宽足以充分发挥 256 个核心的性能;HPE ProLiant Compute XD230 提供了液冷 1U 平台。所有测试结果均经由 STAC 独立审计。

这一成绩也延续了美光助力 STAC 基准测试屡创佳绩的过往履历。在之前的一次 STAC-A2 合作中,美光内存助力实现了突破性的低延迟表现——仅需 35.2 毫秒即可获得市场洞察,这直观地证明了内存带宽可显著提升金融分析效率。本次 STAC-A2 测试成果在此基础上再进阶,MRDIMM 内存不断突破吞吐量、能源效率与计算密度的极限。

如需查看完整的 STAC-A2 审计结果,请访问 www.stacresearch.com/INTC260430

注意:本博客中引用的所有性能结果均取自 2026 年 5 月 5 日进行的 STAC-A2 经审计基准测试(SUT ID:INTC260430)。实际结果可能有所差异。请参阅 www.stacresearch.com/INTC260430 获取完整配置信息。美光、美光徽标和所有其他美光商标均为 Micron Technology, Inc. 的财产。英特尔、至强及英特尔徽标均为 Intel Corporation 的商标。HPE 和 ProLiant 是 Hewlett Packard Enterprise 的商标。STAC 和 STAC-A2 是 Securities Technology Analysis Center, LLC 的商标。

首席存储解决方案工程师

Sujit Somandepalli

Sujit Somandepalli 现任美光科技首席存储解决方案工程师。

英特尔解决方案架构师

特邀撰稿人, Kevin Gildea

Kevin Gildea 现任英特尔解决方案架构师,负责与全球金融和贸易公司建立工程合作伙伴关系。他近期的研究成果主要聚焦于优化 HPC 和低延迟工作负载。Kevin 曾在慧与科技(Hewlett Packard Enterprise,简称 HPE)担任首席架构师,负责在超大规模数据中心部署、高性能计算和 AI 基础设施等领域与云服务提供商合作。Kevin 拥有麻省理工学院理学学士学位,现居纽约。

Global Industry GTM lead for Financial Services

HPE guest author Joe Fuchs

Joe Fuchs joined Hewlett Packard Enterprise in May 2022 as Worldwide AI Solutions Lead for Financial Services and Insurance, and is now Global Industry GTM lead for Financial Services Industry. His focus areas include AI workloads and building full-stack solutions that solve industry problems for diversified financial services holding companies, traditional banks, capital markets, insurance, fintech, accounting and consulting firms. Joe holds an MBA from Canisius College in Buffalo, NY in Finance and Information Systems and a Certified Program Manager certification from the Stanford University Graduate School of Business.

相关博客