Mô hình AI rẻ tiền đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Công ty tuyên bố đã đào tạo mạng lưới thần kinh Deepseek V3 mạnh mẽ của mình chỉ với 6 triệu đô la chỉ sử dụng 2048 GPU, làm giảm đáng kể các đối thủ cạnh tranh. Tuy nhiên, con số này là sai lệch.
Hình ảnh: Obligame.com
DeepSeek V3 tận dụng các công nghệ sáng tạo: Dự đoán đa điểm (MTP) để nâng cao độ chính xác và hiệu quả; Hỗn hợp các chuyên gia (MOE) , sử dụng 256 mạng lưới thần kinh, để tăng tốc đào tạo và cải thiện hiệu suất; và sự chú ý tiềm ẩn đa đầu (MLA) để tập trung vào các yếu tố câu quan trọng, giảm thiểu mất thông tin.
Hình ảnh: Obligame.com
Trái với yêu cầu ban đầu của họ, Semianalysis cho thấy cơ sở hạ tầng rộng lớn của Deepseek, bao gồm khoảng 50.000 GPU phễu NVIDIA trên nhiều trung tâm dữ liệu, đại diện cho tổng đầu tư khoảng 1,6 tỷ đô la và chi phí hoạt động là 944 triệu đô la. Điều này bao gồm đầu tư đáng kể vào nhân sự, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm.
Hình ảnh: Obligame.com
Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, cung cấp quyền kiểm soát lớn hơn và thực hiện đổi mới nhanh hơn. Cách tiếp cận tự tài trợ này góp phần vào sự nhanh nhẹn của nó. Con số 6 triệu đô la chỉ phản ánh chi phí GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và cơ sở hạ tầng. Đầu tư thực tế của Deepseek vào phát triển AI vượt quá 500 triệu đô la.
Hình ảnh: Obligame.com
Trong khi thành công của Deepseek bắt nguồn từ đầu tư đáng kể, những tiến bộ công nghệ và một nhóm lành nghề, thì tường thuật "thân thiện với ngân sách" của nó là một sự đơn giản hóa. Tuy nhiên, ngay cả với các số liệu được sửa chữa, chi phí của Deepseek vẫn nhợt nhạt so với các đối thủ cạnh tranh. Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la để đào tạo, trong khi TATGPT-4 có giá 100 triệu đô la. Tuy nhiên, hiệu quả và cấu trúc tập trung của công ty cho phép nó cạnh tranh hiệu quả với những người khổng lồ trong ngành, mặc dù đầu tư đáng kể liên quan.