首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Andrew Feb 26,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。该公司声称,仅使用2048 GPU培训了其强大的DeepSeek V3神经网络,仅需600万美元,大大削弱了竞争对手。但是,这个数字具有误导性。

DeepSeek Test图像:ensigame.com

DeepSeek V3利用创新技术:多token预测(MTP),以提高准确性和效率; 专家(MOE)的混合物,利用256个神经网络,加速培训并提高绩效; 多头的潜在注意力(MLA)专注于关键句子元素,从而最大程度地减少信息丢失。

DeepSeek V3图像:ensigame.com

与最初的主张相反,半分析显示DeepSeek广泛的基础设施,包括多个数据中心的大约50,000个NVIDIA HOPPER GPU,总投资约为16亿美元,运营成本为9.44亿美元。这包括对人员进行大量投资,一些研究人员每年收入超过130万美元。

DeepSeek图像:ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心,提供了更大的控制和更快的创新实施。这种自资助的方法有助于其敏捷性。这笔600万美元的数字仅反映了培训前的GPU成本,不包括研究,改进,数据处理和基础架构。 DeepSeek对AI开发的实际投资超过5亿美元。

DeepSeek图像:ensigame.com

尽管DeepSeek的成功源于大量投资,技术进步和熟练的团队,但其“预算友好”的叙述是过分简化的。但是,即使有了校正的数字,与竞争对手相比,DeepSeek的成本仍然苍白。例如,DeepSeek的R1型号的培训花费了500万美元,而Chatgpt-4的售价为1亿美元。但是,尽管涉及大量投资,但该公司的效率和集中的结构使其能够与行业巨头有效竞争。