AI进入Agent时代，CPU何以站上“算力C位”？

mynccs · 发表于 2026-2-1 18:00:35

最新研究显示，在完整的Agent执行链路中，工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下，CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果揭示了在大量Agentic场景中，系统吞吐受限的并非GPU计算能力，而是CPU的核心数并发调度问题。
就在日前，GPU的超级玩家英伟达主动掏出20亿美元追加认购CoreWeave股票，并声称后者将在其平台上部署Vera CPU——一款专为“代理式推理（Agentic Reasoning）”设计，且在大规模AI工厂最具能效优势的CPU。据悉，因ARM CPU瓶颈，英伟达已计划在下一代Rubin架构中大幅提升CPU核心数，并开放NVL72机柜对x86CPU的支持。

对话靠GPU，执行靠CPU
是什么让CPU从AI算力界的“冷板凳”上站起，成为需要被单独规划的核心资源池？多个机构总结道，Agent对CPU需求提升主要来自三方面，即应用调度压力、高并发工具调用成为瓶颈，以及沙箱隔离抬升刚性开销。
应用调度压力较好理解，当AI智能体层出不穷，服务器端整体调用频次与覆盖面显著升高，便会带来更多系统请求、数据搬运与控制流开销。

		自动登录	找回密码
密码			注册

[【其它】] AI进入Agent时代，CPU何以站上“算力C位”？

评分

浏览过的版块