Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Şirket, güçlü Deepseek V3 sinir ağını sadece 2048 GPU kullanarak sadece 6 milyon dolar için eğittiğini ve rakipleri önemli ölçüde azalttığını iddia ediyor. Ancak, bu rakam yanıltıcıdır.
%İmgp%resim: ensigame.com
Deepseek V3 Yenilikçi Teknolojilerden yararlanır: Çoklu Tokul Tahmin (MTP) Geliştirilmiş doğruluk ve verimlilik için; Eğitimi hızlandırmak ve performansı artırmak için 256 sinir ağı kullanan uzmanların (MOE) karışımı; ve Çok Baş Gizli Dikkat (MLA) Önemli cümle unsurlarına odaklanmak, bilgi kaybını en aza indirmek.
%İmgp%resim: ensigame.com
İlk iddialarının aksine, Semianaliz, Deepseek'in kapsamlı altyapısını, yaklaşık 50.000 NVIDIA Hopper GPU'sundan oluşan ve toplam 1,6 milyar dolarlık toplam yatırım ve 944 milyon dolarlık operasyonel maliyeti temsil eden ortaya çıktı. Bu, personele önemli yatırımları içerir ve bazı araştırmacılar yılda 1,3 milyon doların üzerinde kazanır.
%İmgp%resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'ın bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, daha fazla kontrol ve daha hızlı inovasyon uygulaması sağlıyor. Bu kendi kendine finanse edilen yaklaşım çevikliğine katkıda bulunur. 6 milyon dolarlık rakam, araştırma, arıtma, veri işleme ve altyapı hariç, sadece eğitim öncesi GPU maliyetlerini yansıtmaktadır. Deepseek'in AI gelişimine gerçek yatırımı 500 milyon doları aşıyor.
%İmgp%resim: ensigame.com
Deepseek'in başarısı önemli yatırım, teknolojik gelişmeler ve yetenekli bir ekipten kaynaklanırken, "bütçe dostu" anlatısı aşırı basitleştirme. Bununla birlikte, düzeltilmiş rakamlarla bile, Deepseek'in maliyetleri rakiplere kıyasla hala solgun. Örneğin, Deepseek'in R1 modelinin eğitilmesi 5 milyon dolara mal olurken, Chatgpt-4'ün maliyeti 100 milyon dolar. Bununla birlikte, şirketin verimliliği ve odaklanmış yapısı, önemli yatırımlara rağmen, endüstri devleriyle etkili bir şekilde rekabet etmesini sağlar.