找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 86|回复: 0

[【其它】] Tomshardware:DeepSeek可能没有宣传那么神 没什么奇迹

[复制链接]
发表于 2025-2-4 11:25:44 | 显示全部楼层 |阅读模式
快科技2月3日消息,近一周以来,DeepSeek不仅引发了美国硅谷的恐慌,也让很多原本不关心AI的人感受到了中国AI大模型的震撼。
不过,国外老牌硬件网站Tomshardware发文称,DeepSeek可能没有宣传的那么具有颠覆性,在AI领域不存在奇迹。
以下为文章节选(仅供参考,不代表本站观点):
中国初创公司DeepSeek最近因其先进的AI模型R1的计算资源使用量惊人地低,而成为科技界的焦点。
该公司声称DeepSeek的训练成本仅为600万美元以及2048个GPU,其最新的R1模型可以与Open AI的o1相媲美。
然而,行业分析公司SemiAnalysis报告称,DeepSeek背后的公司花费了16 亿美元的服务器成本,并拥有50,000 个NVIDIA Hopper GPU。
报告称,DeepSeek运营着一个拥有约50,000个Hopper GPU的庞大计算基础设施。根据 SemiAnalysis 的数据,其中包括10,000个H800和10,000个H100,另外还购买了H20芯片。
这些资源分布在多个位置,用于AI训练、研究和财务建模等。SemiAnalysis的数据显示,该公司在服务器上的总资本投资约为16亿美元,估计运营成本为9.44亿美元。
DeepSeek 起源于High-Flyer(幻方),这是一家中国对冲基金,很早就采用了人工智能,并在GPU上投入了大量资金。
2023 年,High-Flyer成立了 DeepSeek,作为一家专注于人工智能的独立企业。与许多竞争对手不同,DeepSeek 仍是自筹资金,这使其在决策方面具有速度和灵活性。
DeepSeek的一个主要优势在于它能够运行自己的数据中心,而大多数其他AI初创公司则依赖外部云提供商。这种独立性允许其完全控制测试和AI模型优化。
此外,它能够快速迭代而不受外部瓶颈的影响,这使得DeepSeek与业内传统参与者相比效率极高。
根据SemiAnalysis的数据,DeepSeek只在中国境内招聘,注重员工的技能和解决问题的能力,而非资历。
DeepSeek面向北京大学、浙江大学等知名高校招聘人才,并提供极具竞争力的薪水。根据研究,DeepSeek的一些人工智能研究人员的薪酬超过130万美元(约合942.7万元人民币),超过了 Moonshot(月之暗面)等其他领先的中国人工智能公司的薪酬。
SemiAnalysis报告称,由于人才的涌入,DeepSeek率先推出了MLA等创新技术。DeepSeek 强调效率和算法改进,而不是蛮力扩展,重塑了人们对AI模型开发的期望。
出于多种原因,这也让大家相信,技术的快速进步可能会减少对高端GPU的需求,从而对NVIDIA等公司产生利空应影响。
最近有消息称,DeepSeek 仅花费600万美元训练其最新模型,但这个数字仅指总训练成本的一部分——不包括研究、模型改进、数据处理或整体基础设施费用。
事实上,自成立以来,DeepSeek在人工智能开发上花费了超过5亿美元。SemiAnalysis认为,与受官僚主义困扰的大型公司不同,DeepSeek 的精益结构使其能够积极推动人工智能创新。
DeepSeek的崛起凸显了一家资金雄厚的独立AI公司如何挑战行业领导者。但现实情况要复杂得多:SemiAnalysis 认为DeepSeek的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。
这意味着没有什么奇迹。正如埃隆·马斯克一年前指出的那样,如果你想在AI领域具有竞争力,你就必须每年投入数十亿美元

评分

1

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2025-12-14 01:55 , Processed in 0.082192 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表