Tomshardware：DeepSeek可能没有宣传那么神没什么奇迹

YS_YY · 发表于 2025-2-4 11:25:44

快科技2月3日消息，近一周以来，DeepSeek不仅引发了美国硅谷的恐慌，也让很多原本不关心AI的人感受到了中国AI大模型的震撼。

不过，国外老牌硬件网站Tomshardware发文称，DeepSeek可能没有宣传的那么具有颠覆性，在AI领域不存在奇迹。

以下为文章节选（仅供参考，不代表本站观点）：

中国初创公司DeepSeek最近因其先进的AI模型R1的计算资源使用量惊人地低，而成为科技界的焦点。

该公司声称DeepSeek的训练成本仅为600万美元以及2048个GPU，其最新的R1模型可以与Open AI的o1相媲美。

然而，行业分析公司SemiAnalysis报告称，DeepSeek背后的公司花费了16 亿美元的服务器成本，并拥有50,000 个NVIDIA Hopper GPU。

报告称，DeepSeek运营着一个拥有约50,000个Hopper GPU的庞大计算基础设施。根据 SemiAnalysis 的数据，其中包括10,000个H800和10,000个H100，另外还购买了H20芯片。

这些资源分布在多个位置，用于AI训练、研究和财务建模等。SemiAnalysis的数据显示，该公司在服务器上的总资本投资约为16亿美元，估计运营成本为9.44亿美元。

DeepSeek 起源于High-Flyer（幻方），这是一家中国对冲基金，很早就采用了人工智能，并在GPU上投入了大量资金。

2023 年，High-Flyer成立了 DeepSeek，作为一家专注于人工智能的独立企业。与许多竞争对手不同，DeepSeek 仍是自筹资金，这使其在决策方面具有速度和灵活性。

DeepSeek的一个主要优势在于它能够运行自己的数据中心，而大多数其他AI初创公司则依赖外部云提供商。这种独立性允许其完全控制测试和AI模型优化。

此外，它能够快速迭代而不受外部瓶颈的影响，这使得DeepSeek与业内传统参与者相比效率极高。

根据SemiAnalysis的数据，DeepSeek只在中国境内招聘，注重员工的技能和解决问题的能力，而非资历。

DeepSeek面向北京大学、浙江大学等知名高校招聘人才，并提供极具竞争力的薪水。根据研究，DeepSeek的一些人工智能研究人员的薪酬超过130万美元（约合942.7万元人民币），超过了 Moonshot（月之暗面）等其他领先的中国人工智能公司的薪酬。

SemiAnalysis报告称，由于人才的涌入，DeepSeek率先推出了MLA等创新技术。DeepSeek 强调效率和算法改进，而不是蛮力扩展，重塑了人们对AI模型开发的期望。

出于多种原因，这也让大家相信，技术的快速进步可能会减少对高端GPU的需求，从而对NVIDIA等公司产生利空应影响。

最近有消息称，DeepSeek 仅花费600万美元训练其最新模型，但这个数字仅指总训练成本的一部分——不包括研究、模型改进、数据处理或整体基础设施费用。

事实上，自成立以来，DeepSeek在人工智能开发上花费了超过5亿美元。SemiAnalysis认为，与受官僚主义困扰的大型公司不同，DeepSeek 的精益结构使其能够积极推动人工智能创新。

DeepSeek的崛起凸显了一家资金雄厚的独立AI公司如何挑战行业领导者。但现实情况要复杂得多：SemiAnalysis 认为DeepSeek的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。

这意味着没有什么奇迹。正如埃隆·马斯克一年前指出的那样，如果你想在AI领域具有竞争力，你就必须每年投入数十亿美元。

		自动登录	找回密码
密码			注册

[【其它】] Tomshardware：DeepSeek可能没有宣传那么神没什么奇迹