首页新闻 DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

作者 : Andrew Feb 26,2025

DeepSeek令人惊讶的是，廉价的AI模型挑战了行业巨头。该公司声称，仅使用2048 GPU培训了其强大的DeepSeek V3神经网络，仅需600万美元，大大削弱了竞争对手。但是，这个数字具有误导性。

DeepSeek Test 图像：ensigame.com

DeepSeek V3利用创新技术：多token预测（MTP)，以提高准确性和效率； 专家（MOE)的混合物，利用256个神经网络，加速培训并提高绩效； 多头的潜在注意力（MLA)专注于关键句子元素，从而最大程度地减少信息丢失。

DeepSeek V3 图像：ensigame.com

与最初的主张相反，半分析显示DeepSeek广泛的基础设施，包括多个数据中心的大约50,000个NVIDIA HOPPER GPU，总投资约为16亿美元，运营成本为9.44亿美元。这包括对人员进行大量投资，一些研究人员每年收入超过130万美元。

DeepSeek 图像：ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心，提供了更大的控制和更快的创新实施。这种自资助的方法有助于其敏捷性。这笔600万美元的数字仅反映了培训前的GPU成本，不包括研究，改进，数据处理和基础架构。 DeepSeek对AI开发的实际投资超过5亿美元。

DeepSeek 图像：ensigame.com

尽管DeepSeek的成功源于大量投资，技术进步和熟练的团队，但其“预算友好”的叙述是过分简化的。但是，即使有了校正的数字，与竞争对手相比，DeepSeek的成本仍然苍白。例如，DeepSeek的R1型号的培训花费了500万美元，而Chatgpt-4的售价为1亿美元。但是，尽管涉及大量投资，但该公司的效率和集中的结构使其能够与行业巨头有效竞争。