Invalid input. Special characters are not supported.
创纪录的 STAC-A2 基准测试揭示了计算-内存协同对金融建模的重要性。
内存在金融基础设施中的真实定位
内存在金融系统中一直扮演着重要角色,却长期被视作辅助性的存在。人们认为它仅仅是可靠的数据存储载体,而非影响决策的核心因素。这种认知的形成,部分原因在于内存性能的提升始终是渐进式的,且未得到充分宣传1。过去,许多金融工作负载都围绕 CPU 性能和存储进行调优,而内存带宽的瓶颈效应直到近年才得到关注2。然而,这一观念正在改变。内存始终是系统的基石,而如今的系统架构师正基于全新认知进行设计,即计算与内存必须深度协同。这一转变在金融建模和 HPC 系统中尤为明显:当数千个模拟并行运行时,数据必须以足够快的速度传输,才能与模型的计算逻辑保持同步。系统的行为并非由单一组件决定,而是取决于计算与内存的协同调优程度,以及架构师能否在整个技术栈中实现这种高效配合。在这种设计理念下,内存发挥着独特的作用:它决定了数据流动的速度,以及数据在系统中实现顺畅传输的效率。
对于构建风险引擎的 HPC 架构师而言,内存已不再是技术栈中的普通组件,而是决定系统金融建模规模与速度的关键因素。这些系统的构建者位于硬件与金融市场的交叉领域,他们必须不断思考:
我们该如何构建(系统级)架构,才能在市场波动前抢占先机?
本篇博客虽以最近打破世界纪录的 STAC-A2 基准测试结果作为引子,但目的不在于宣传相关产品,而是以此为剖析对象,揭示当内存与计算经过协同调优后可能实现的突破。这项由搭载英特尔® 至强® 6 处理器和美光 8800 MT/s MRDIMM(多路复用列 DIMM)的系统创造的纪录绝非偶然。它源于精心的系统级设计:美光与英特尔紧密合作,在系统层面实现了内存与计算架构的精准匹配。
这种协同绝非仅停留在设计理念层面,其价值已在真实工作负载的压力测试中得到验证。STAC-A2 基准测试便是绝佳的试金石:该测试通过模拟金融工具在数千种市场情境中的每日表现,旨在将建模系统的性能推至极限。接下来我们将详细介绍该基准测试对系统的要求,以及当需求规模扩大时,系统如何通过持续稳定的内存吞吐量与系统级协调能力来应对挑战。
STAC-A2 基准测试深入分析
STAC-A2 基准测试对平台提出了极高要求:需同步模拟数千种金融场景。这些场景基于所谓的“模拟价格路径”(即通过建模,来预测多资产期权等金融工具在市场涨跌或横盘时的动态表现)构建。这不仅是对计算能力的压力测试,对内存亦是如此。
典型的测试需建模数千条价格路径,每条路径包含 252 个时间间隔。252 这个数字并非随意设定,它对应着常规年度的交易日数量。因此,当我们说该基准测试模拟 252 个“时间步长”下的数千种结果时,其实质是:系统需对 25,000 种不同金融场景进行全年逐日市场行为建模3。这意味着数千个计算任务并行展开,每个核心均需保持持续稳定的性能输出,同时,由于在整个模拟过程中,大量线程需不断对共享内存进行读写操作,导致内存带宽也被推向极限。最终,系统的整体速度完全取决于内存性能上限。
现实案例解析
执行 STAC-A2 基准测试时,系统并非仅对单一金融结果建模,而是需同时对数千种可能结果建模。这些负载会被分配到不同线程。线程是系统内部的微指令流,每个线程负责追踪一个不同的场景。单个线程的工作流程包括获取数据和执行运算:f(x) = [(波动率 × 过度自信系数²) ÷ 遗留代码] + 1 条精准时机的市场推文的影响。之后,它会将这些结果写回内存。
所有路径都是并行计算,人眼无法实时捕捉全部过程。让我们通过慢镜头分解,仅追踪其中的几条路径。
假设有一份与某虚拟股票挂钩的期权合约,该股票在 2025 年 6 月 4 日的收盘价为 103 美元。一条模拟路径可能显示,该股票在 75 个交易日内会上涨至 125 美元,这使得提前行使期权成为有利可图的选择。而另一条路径可能显示股价始终在 100 美元附近徘徊,导致期权最终毫无价值3。
图 1 显示了基准测试可能会探索的三条可能路径(选取自 25,000 条路径)。
现在,请想象这样的模拟在整个交易年度中重复数千次。这正是 STAC-A2 基准测试所要施加的计算压力,也是我们创造世界纪录的关键所在。
基准测试结果揭晓(世界纪录详情)
在美光 MRDIMM 的助力下,英特尔® 至强® 6 处理器在完整交易年模拟中的表现游刃有余,最终创下仅用 35.2 毫秒就完成该基准测试的新世界纪录。新系统的吞吐量达到基线系统的两倍以上,冷启动性能加快近十倍,大型数据集处理速度达到近两倍,同时能源效率较基线系统提高 28%。这一世界纪录揭示了一个深刻事实:内存不仅是系统的支持组件,更是决定运行节奏的关键因素。
表 1. 测试配置详情
当前性能需求对我们的启示
有些测试结果不言自明,有些则能揭示深层洞见。而这次创纪录的表现,两者兼具。在金融风险分析领域创下 STAC-A2 世界纪录固然令人瞩目,但同样重要的是其成功之道:精心设计的系统协同。内存与计算并非各自调优,而是相互协调;每个组件都经过精准校准,以满足系统整体需求。这种深度协作的价值远不止于打破纪录。它能确保在瞬息万变的市场中抢占先机,在行情波动前就生成关键洞察。虽然 STAC-A2 基准测试针对的是特定金融工作负载,但其揭示的原则适用于所有因时效性、数据量和建模复杂度而需要将系统性能推至极限的领域。这正是当系统架构实现内在协同时所带来的质变。内存与计算能预测彼此需求,而非争夺资源控制权。
因为在如此大的规模下,系统性能不仅取决于运行速度,更取决于其底层架构的协作关系。
了解详情
致谢
本次 STAC-A2 基准测试是英特尔、STAC (Strategic Technology Analysis Center) 与美光通力协作的结果。美光技术团队由 Sravani Gomatam、Sudharshan Vazhkudai、Judy Ducharme 和 Jay Walstrum 领衔,主导了测试方案设计与系统配置工作。完整报告详见:https://stacresearch.com/INTC250422。
1. SemiAnalysis。2024 年 9 月 3 日。“The memory wall: When DRAM stopped scaling”。https://semianalysis.com/2024/09/03/the-memory-wall/#dram-primer-when-dram-stopped-scaling
2. STAC Research。2022 年。STAC 2022 年秋季峰会 – 纽约市。https://www.stacresearch.com/fall2022NYC
3. Barchart(日期不详)。Micron Technology Inc.(美光科技股份有限公司,股票代码 MU)期权链。https://www.barchart.com/stocks/quotes/MU/options
4. STAC Research。2025 年 5 月 9 日。英特尔 STAC 报告 INTC250422。https://stacresearch.com/INTC250422
5. STAC Research。2024 年 4 月 26 日。英特尔 STAC 报告 INTC240321。https://stacresearch.com/INTC240321