Hogar Noticias La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Autor : Andrew Feb 26,2025

El modelo de IA sorprendentemente económico de Deepseek desafía a los gigantes de la industria. La compañía afirma haber capacitado a su poderosa red neuronal de Deepseek V3 por solo $ 6 millones utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, esta figura es engañosa.

DeepSeek TestImagen: Ensigame.com

Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales, para acelerar la capacitación y mejorar el rendimiento; y Atención latente de múltiples cabezas (MLA) para centrarse en elementos de oración cruciales, minimizando la pérdida de información.

DeepSeek V3Imagen: Ensigame.com

Al contrario de su reclamo inicial, el semánisis reveló la extensiva infraestructura de Deepseek, que comprende aproximadamente 50,000 GPU de la tolva NVIDIA en múltiples centros de datos, lo que representa una inversión total de aproximadamente $ 1.6 mil millones y costos operativos de $ 944 millones. Esto incluye una inversión sustancial en personal, y algunos investigadores ganan más de $ 1.3 millones anuales.

DeepSeekImagen: Ensigame.com

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, proporcionando un mayor control e implementación de innovación más rápida. Este enfoque autofinanciado contribuye a su agilidad. La cifra de $ 6 millones solo refleja los costos de GPU previos al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión real de Deepseek en el desarrollo de IA supera los $ 500 millones.

DeepSeekImagen: Ensigame.com

Si bien el éxito de Deepseek proviene de una inversión sustancial, avances tecnológicos y un equipo calificado, su narrativa "económica" es una simplificación excesiva. Sin embargo, incluso con las cifras corregidas, los costos de Deepseek aún palidecen en comparación con los competidores. Por ejemplo, el modelo R1 de Deepseek costó $ 5 millones para entrenar, mientras que ChatGPT-4 costó $ 100 millones. Sin embargo, la eficiencia y la estructura enfocada de la compañía le permiten competir de manera efectiva con los gigantes de la industria, a pesar de la inversión sustancial involucrada.