Rumah Berita Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

Pengarang : Joseph Kemas kini : Mar 16,2025

Chatbot baru Deepseek mempunyai pengenalan yang mengagumkan: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." AI ini, produk permulaan Cina Deepseek, dengan cepat menjadi pemain pasaran utama, bahkan menyumbang kepada penurunan harga saham Nvidia yang signifikan. Kejayaannya berasal dari metodologi seni bina dan latihan yang unik, menggabungkan beberapa teknologi inovatif.

Ramalan Multi-Token (MTP): Tidak seperti ramalan kata-kata tradisional, MTP meramalkan pelbagai perkataan secara serentak, menganalisis bahagian ayat yang berbeza untuk ketepatan dan kecekapan yang lebih baik.

Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input, mempercepat latihan AI dan meningkatkan prestasi. DeepSeek V3 menggunakan 256 rangkaian saraf, mengaktifkan lapan untuk setiap tugas pemprosesan token.

Perhatian Laten Multi-Head (MLA): Mekanisme ini memberi tumpuan kepada unsur-unsur kalimat yang penting, berulang kali mengeluarkan butiran utama dari serpihan teks untuk meminimumkan kehilangan maklumat dan menangkap nuansa halus.

Deepseek pada mulanya mendakwa telah melatih rangkaian saraf Deepseek V3 yang kuat untuk hanya $ 6 juta menggunakan 2048 GPU. Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang jauh lebih besar: kira -kira 50,000 NVIDIA Hopper GPU, termasuk 10,000 H800s, 10,000 H100s, dan GPU tambahan H20, tersebar di pelbagai pusat data. Ini mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan sebanyak $ 944 juta.

DeepSeek, anak syarikat dana lindung nilai Cina yang tinggi, memiliki pusat datanya, memberikan kawalan sepenuhnya ke atas pengoptimuman model AI dan pelaksanaan inovasi yang lebih cepat. Pendekatan yang dibiayai sendiri ini meningkatkan kelajuan fleksibiliti dan membuat keputusan. Syarikat itu juga menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya merekrut dari universiti -universiti China yang terkemuka.

Walaupun tuntutan kos latihan awal $ 6 juta DeepSeek nampaknya tidak realistik-merujuk hanya kepada penggunaan pra-latihan GPU dan tidak termasuk perbelanjaan lain-syarikat telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur padatnya membolehkan pelaksanaan inovasi yang cekap, berbeza dengan birokrasi syarikat yang lebih besar.

Kejayaan DeepSeek mempamerkan potensi syarikat AI bebas yang dibiayai dengan baik untuk bersaing dengan gergasi industri. Walaupun tuntutan "bajet revolusioner" dibesar -besarkan, berbilion -bilion dalam pelaburan, kejayaan teknologi, dan pasukan yang kuat adalah faktor yang tidak dapat dinafikan dalam kejayaannya. Sebaliknya adalah menarik apabila mempertimbangkan kos pesaing; DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4 berharga $ 100 juta. Walaupun pelaburan yang signifikan, kos DeepSeek kekal jauh lebih rendah daripada pesaingnya.

Ujian DeepSeek DeepSeek V3