找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 80|回复: 0

[【其它】] AI进入Agent时代,CPU何以站上“算力C位”?

[复制链接]
发表于 2026-2-1 18:00:35 来自手机 | 显示全部楼层 |阅读模式
最新研究显示,在完整的Agent执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下,CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果揭示了在大量Agentic场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心数并发调度问题。
就在日前,GPU的超级玩家英伟达主动掏出20亿美元追加认购CoreWeave股票,并声称后者将在其平台上部署Vera CPU——一款专为“代理式推理(Agentic Reasoning)”设计,且在大规模AI工厂最具能效优势的CPU。据悉,因ARM CPU瓶颈,英伟达已计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支持。

对话靠GPU,执行靠CPU
是什么让CPU从AI算力界的“冷板凳”上站起,成为需要被单独规划的核心资源池?多个机构总结道,Agent对CPU需求提升主要来自三方面,即应用调度压力、高并发工具调用成为瓶颈,以及沙箱隔离抬升刚性开销。
应用调度压力较好理解,当AI智能体层出不穷,服务器端整体调用频次与覆盖面显著升高,便会带来更多系统请求、数据搬运与控制流开销。

评分

1

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2026-3-27 17:45 , Processed in 0.099080 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表