Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das Unternehmen behauptet, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit nur 2048 GPUs ausgebildet zu haben und die Wettbewerber erheblich zu unterbinden. Diese Zahl ist jedoch irreführend.
Bild: Ensigame.com
Deepseek V3 nutzt innovative Technologien: Multi-Tooken-Vorhersage (MTP) für verbesserte Genauigkeit und Effizienz; Mischung aus Experten (MOE) unter Verwendung von 256 neuronalen Netzwerken, um das Training zu beschleunigen und die Leistung zu verbessern; und Multi-Head Latent Achtung (MLA) sich auf wichtige Satzelemente zu konzentrieren und den Informationsverlust zu minimieren.
Bild: Ensigame.com
Im Gegensatz zu ihrer ersten Behauptung ergab die semianalyse die umfangreiche Infrastruktur von Deepseek, die rund 50.000 NVIDIA Hopper -GPUs in mehreren Rechenzentren umfasste, was eine Gesamtinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten von 944 Mio. USD entspricht. Dies schließt erhebliche Investitionen in das Personal ein, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt seine Rechenzentren und bietet eine stärkere Kontrolle und schnellere Innovationsimplementierung. Dieser selbstfinanzierte Ansatz trägt zu seiner Beweglichkeit bei. Die 6-Millionen-Dollar-Zahl spiegelt nur die GPU-Kosten vor der Training wider, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die tatsächliche Investition von Deepseek in die KI -Entwicklung übersteigt 500 Millionen US -Dollar.
Bild: Ensigame.com
Während Deepseeks Erfolg auf erhebliche Investitionen, technologische Fortschritte und ein qualifiziertes Team beruht, ist seine "budgetfreundliche" Erzählung eine zu vereinfachte Vereinfachung. Trotz der korrigierten Zahlen blassen Deepseeks Kosten im Vergleich zu Wettbewerbern immer noch immer noch. Zum Beispiel kostete das Trainer von Deepseeks R1-Modell 5 Millionen US-Dollar, während Chatgpt-4 100 Millionen US-Dollar kostete. Die Effizienz und die fokussierte Struktur des Unternehmens ermöglichen es ihm jedoch, trotz der erheblichen Investitionen effektiv mit Branchenriesen zu konkurrieren.