设计工具

Invalid input. Special characters are not supported.

数据中心

35.2 毫秒洞悉市场脉搏

Evelyn Grevelink、Kevin Gildea(特约撰稿人)| 2025 年 6 月

创纪录的 STAC-A2 基准测试揭示了计算-内存协同对金融建模的重要性。

内存在金融基础设施中的真实定位

内存在金融系统中一直扮演着重要角色,却长期被视作辅助性的存在。人们认为它仅仅是可靠的数据存储载体,而非影响决策的核心因素。这种认知的形成,部分原因在于内存性能的提升始终是渐进式的,且未得到充分宣传1。过去,许多金融工作负载都围绕 CPU 性能和存储进行调优,而内存带宽的瓶颈效应直到近年才得到关注2。然而,这一观念正在改变。内存始终是系统的基石,而如今的系统架构师正基于全新认知进行设计,即计算与内存必须深度协同。这一转变在金融建模和 HPC 系统中尤为明显:当数千个模拟并行运行时,数据必须以足够快的速度传输,才能与模型的计算逻辑保持同步。系统的行为并非由单一组件决定,而是取决于计算与内存的协同调优程度,以及架构师能否在整个技术栈中实现这种高效配合。在这种设计理念下,内存发挥着独特的作用:它决定了数据流动的速度,以及数据在系统中实现顺畅传输的效率。 

对于构建风险引擎的 HPC 架构师而言,内存已不再是技术栈中的普通组件,而是决定系统金融建模规模与速度的关键因素。这些系统的构建者位于硬件与金融市场的交叉领域,他们必须不断思考:

我们该如何构建
系统级)架构,才能在市场波动前抢占先机?

本篇博客虽以最近打破世界纪录的 STAC-A2 基准测试结果作为引子,但目的不在于宣传相关产品,而是以此为剖析对象,揭示当内存与计算经过协同调优后可能实现的突破。这项由搭载英特尔® 至强® 6 处理器和美光 8800 MT/s MRDIMM(多路复用列 DIMM)的系统创造的纪录绝非偶然。它源于精心的系统级设计:美光与英特尔紧密合作,在系统层面实现了内存与计算架构的精准匹配。

这种协同绝非仅停留在设计理念层面,其价值已在真实工作负载的压力测试中得到验证。STAC-A2 基准测试便是绝佳的试金石:该测试通过模拟金融工具在数千种市场情境中的每日表现,旨在将建模系统的性能推至极限。接下来我们将详细介绍该基准测试对系统的要求,以及当需求规模扩大时,系统如何通过持续稳定的内存吞吐量与系统级协调能力来应对挑战。

STAC-A2 基准测试深入分析

STAC-A2 基准测试对平台提出了极高要求:需同步模拟数千种金融场景。这些场景基于所谓的“模拟价格路径”(即通过建模,来预测多资产期权等金融工具在市场涨跌或横盘时的动态表现)构建。这不仅是对计算能力的压力测试,对内存亦是如此。

典型的测试需建模数千条价格路径,每条路径包含 252 个时间间隔。252 这个数字并非随意设定,它对应着常规年度的交易日数量。因此,当我们说该基准测试模拟 252 个“时间步长”下的数千种结果时,其实质是:系统需对 25,000 种不同金融场景进行全年逐日市场行为建模3。这意味着数千个计算任务并行展开,每个核心均需保持持续稳定的性能输出,同时,由于在整个模拟过程中,大量线程需不断对共享内存进行读写操作,导致内存带宽也被推向极限。最终,系统的整体速度完全取决于内存性能上限。

测试

图 1. 某期权合约的三条可能路径,这只是 STAC-A2 基准测试所做模拟的一小部分。

现实案例解析

执行 STAC-A2 基准测试时,系统并非仅对单一金融结果建模,而是需同时对数千种可能结果建模。这些负载会被分配到不同线程。线程是系统内部的微指令流,每个线程负责追踪一个不同的场景。单个线程的工作流程包括获取数据和执行运算:f(x) = [(波动率 × 过度自信系数²) ÷ 遗留代码] + 1 条精准时机的市场推文的影响。之后,它会将这些结果写回内存。

所有路径都是并行计算,人眼无法实时捕捉全部过程。让我们通过慢镜头分解,仅追踪其中的几条路径。

假设有一份与某虚拟股票挂钩的期权合约,该股票在 2025 年 6 月 4 日的收盘价为 103 美元。一条模拟路径可能显示,该股票在 75 个交易日内会上涨至 125 美元,这使得提前行使期权成为有利可图的选择。而另一条路径可能显示股价始终在 100 美元附近徘徊,导致期权最终毫无价值3

图 1 显示了基准测试可能会探索的三条可能路径(选取自 25,000 条路径)。

现在,请想象这样的模拟在整个交易年度中重复数千次。这正是 STAC-A2 基准测试所要施加的计算压力,也是我们创造世界纪录的关键所在。

基准测试结果揭晓(世界纪录详情)

在美光 MRDIMM 的助力下,英特尔® 至强® 6 处理器在完整交易年模拟中的表现游刃有余,最终创下仅用 35.2 毫秒就完成该基准测试的新世界纪录。新系统的吞吐量达到基线系统的两倍以上,冷启动性能加快近十倍,大型数据集处理速度达到近两倍,同时能源效率较基线系统提高 28%。这一世界纪录揭示了一个深刻事实:内存不仅是系统的支持组件,更是决定运行节奏的关键因素。

 基线系统5新系统(世界纪录保持者)4
处理器2x 英特尔® 至强® Platinum 8592+ 处理器2x 英特尔® 至强® 6980P 处理器
内存16x 64GB DDR5 RDIMM @5600 MT/s24x 美光 64GB DDR5 4x8 MRDIMM @8800 MT/s
软件堆栈STAC-A2 英特尔® oneAPI 套件(版本 N)STAC-A2 oneAPI 套件(版本 R)
操作系统Red Hat Enterprise Linux® 9.3Red Hat Enterprise Linux® 9.5


表 1.
测试配置详情
 

当前性能需求对我们的启示

有些测试结果不言自明,有些则能揭示深层洞见。而这次创纪录的表现,两者兼具。在金融风险分析领域创下 STAC-A2 世界纪录固然令人瞩目,但同样重要的是其成功之道:精心设计的系统协同。内存与计算并非各自调优,而是相互协调;每个组件都经过精准校准,以满足系统整体需求。这种深度协作的价值远不止于打破纪录。它能确保在瞬息万变的市场中抢占先机,在行情波动前就生成关键洞察。虽然 STAC-A2 基准测试针对的是特定金融工作负载,但其揭示的原则适用于所有因时效性、数据量和建模复杂度而需要将系统性能推至极限的领域。这正是当系统架构实现内在协同时所带来的质变。内存与计算能预测彼此需求,而非争夺资源控制权。

因为在如此大的规模下,系统性能不仅取决于运行速度,更取决于其底层架构的协作关系。

了解详情

致谢

本次 STAC-A2 基准测试是英特尔、STAC (Strategic Technology Analysis Center) 与美光通力协作的结果。美光技术团队由 Sravani Gomatam、Sudharshan Vazhkudai、Judy Ducharme 和 Jay Walstrum 领衔,主导了测试方案设计与系统配置工作。完整报告详见:https://stacresearch.com/INTC250422。 
 

 

1. SemiAnalysis。2024 年 9 月 3 日。“The memory wall: When DRAM stopped scaling”。https://semianalysis.com/2024/09/03/the-memory-wall/#dram-primer-when-dram-stopped-scaling 
2. STAC Research。2022 年。STAC 2022 年秋季峰会 – 纽约市。https://www.stacresearch.com/fall2022NYC 
3. Barchart(日期不详)。Micron Technology Inc.(美光科技股份有限公司,股票代码 MU)期权链。https://www.barchart.com/stocks/quotes/MU/options 
4. STAC Research。2025 年 5 月 9 日。英特尔 STAC 报告 INTC250422。https://stacresearch.com/INTC250422 
5. STAC Research。2024 年 4 月 26 日。英特尔 STAC 报告 INTC240321。https://stacresearch.com/INTC240321 

Content Strategy Marketing Lead

Evelyn Grevelink

Evelyn leads the content strategy for the Cloud Memory Business Unit (CMBU) Strategic Marketing team at Micron Technology. She is passionate about acting as a bridge between engineering and marketing through creative, strategic storytelling. Evelyn specializes in writing compelling narratives and designing illustrations to communicate complex concepts for large language models, AI, and advanced memory technologies. She holds a bachelor's degree in physics from California State University, Sacramento. 

Guest author, Kevin Gildea

Kevin is a Solutions Architect at Intel, supporting global financial services clients in adopting next-generation AI and infrastructure technologies. He focuses on creating value where advanced technology meets complex business challenges. Previously, he spent over a decade at Hewlett Packard Enterprise (HPE), partnering with major cloud service providers on hyperscale datacenter deployments, high-performance computing, and AI infrastructure. Kevin holds a Bachelor of Science from MIT and is based in New York City.