Trang chủ Tin tức Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Tác giả : Joseph Cập nhật : Mar 16,2025

Chatbot mới của Deepseek tự hào về phần giới thiệu ấn tượng: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." AI này, một sản phẩm của công ty khởi nghiệp Trung Quốc Deepseek, đã nhanh chóng trở thành một người chơi thị trường lớn, thậm chí góp phần làm giảm đáng kể giá cổ phiếu của NVIDIA. Thành công của nó xuất phát từ một phương pháp đào tạo và kiến ​​trúc độc đáo, kết hợp một số công nghệ sáng tạo.

Dự đoán đa điểm (MTP): Không giống như dự đoán từng từ truyền thống, MTP dự báo đồng thời nhiều từ, phân tích các phần câu khác nhau để cải thiện độ chính xác và hiệu quả.

Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng nhiều mạng lưới thần kinh để xử lý dữ liệu đầu vào, tăng tốc đào tạo AI và tăng cường hiệu suất. Deepseek V3 sử dụng 256 mạng thần kinh, kích hoạt tám mạng cho mỗi nhiệm vụ xử lý mã thông báo.

Sự chú ý tiềm ẩn đa đầu (MLA): Cơ chế này tập trung vào các yếu tố câu quan trọng, liên tục trích xuất các chi tiết chính từ các đoạn văn bản để giảm thiểu mất thông tin và nắm bắt các sắc thái tinh tế.

Deepseek ban đầu tuyên bố đã đào tạo mạng lưới thần kinh Deepseek V3 mạnh mẽ của mình chỉ với 6 triệu đô la sử dụng GPU 2048. Tuy nhiên, bán phân giải cho thấy cơ sở hạ tầng đáng kể hơn nhiều: khoảng 50.000 GPU phễu NVIDIA, bao gồm 10.000 H800, 10.000 H100 và GPU H20 bổ sung, trải đều trên nhiều trung tâm dữ liệu. Điều này thể hiện tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la.

Deepseek, một công ty con của quỹ đầu cơ cao của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, cung cấp quyền kiểm soát hoàn toàn đối với tối ưu hóa mô hình AI và triển khai đổi mới nhanh hơn. Cách tiếp cận tự tài trợ này giúp tăng cường tính linh hoạt và tốc độ ra quyết định. Công ty cũng thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu tuyển dụng từ các trường đại học hàng đầu Trung Quốc.

Trong khi yêu cầu chi phí đào tạo trị giá 6 triệu đô la của Deepseek có vẻ không thực tế, chỉ giới thiệu việc sử dụng GPU trước khi đào tạo và loại trừ các chi phí khác, công ty đã đầu tư hơn 500 triệu đô la vào phát triển AI. Cấu trúc nhỏ gọn của nó cho phép thực hiện đổi mới hiệu quả, tương phản với sự quan liêu của các tập đoàn lớn hơn.

Thành công của Deepseek thể hiện tiềm năng của các công ty AI độc lập được tài trợ tốt để cạnh tranh với các đại gia công nghiệp. Trong khi các tuyên bố "ngân sách cách mạng" của nó được phóng đại, hàng tỷ người đầu tư, đột phá công nghệ và nhóm mạnh là những yếu tố không thể phủ nhận trong thành công của nó. Sự tương phản là nổi bật khi xem xét chi phí của đối thủ cạnh tranh; Deepseek đã chi 5 triệu đô la cho R1, trong khi TATGPT4 có giá 100 triệu đô la. Mặc dù đầu tư đáng kể, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh.

DeepSeek TestDeepseek v3DeepseekDeepseek