Bahay Balita Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

May-akda : Joseph Update : Mar 16,2025

Ipinagmamalaki ng bagong chatbot ng Deepseek ang isang kahanga -hangang pagpapakilala: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang AI na ito, isang produkto ng China Startup Deepseek, ay mabilis na naging isang pangunahing manlalaro ng merkado, kahit na nag -aambag sa isang makabuluhang pagbagsak sa presyo ng stock ni Nvidia. Ang tagumpay nito ay nagmula sa isang natatanging pamamaraan ng arkitektura at pagsasanay, na isinasama ang ilang mga makabagong teknolohiya.

Multi-Token Prediction (MTP): Hindi tulad ng tradisyonal na hula ng salita-by-word, ang mga pagtataya ng MTP ng maraming mga salita nang sabay-sabay, na sinusuri ang iba't ibang mga bahagi ng pangungusap para sa pinabuting katumpakan at kahusayan.

Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng maraming mga neural network upang maproseso ang data ng pag -input, pabilis ang pagsasanay sa AI at pagpapahusay ng pagganap. Ang Deepseek V3 ay gumagamit ng 256 Neural Networks, na nag -activate ng walong para sa bawat gawain sa pagproseso ng token.

Multi-head latent pansin (MLA): Ang mekanismong ito ay nakatuon sa mga mahahalagang elemento ng pangungusap, paulit-ulit na kumukuha ng mga pangunahing detalye mula sa mga fragment ng teksto upang mabawasan ang pagkawala ng impormasyon at makuha ang mga banayad na nuances.

Una nang inangkin ng Deepseek na sinanay ang malakas na Deepseek V3 Neural Network para sa isang $ 6 milyon lamang gamit ang 2048 GPU. Gayunpaman, ang semianalysis ay nagsiwalat ng isang mas malaking imprastraktura: humigit -kumulang na 50,000 NVIDIA HOPPER GPU, kabilang ang 10,000 H800s, 10,000 H100s, at karagdagang mga H20 GPU, kumalat sa maraming mga sentro ng data. Ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

Ang Deepseek, isang subsidiary ng Chinese Hedge Fund High-flyer, ay nagmamay-ari ng mga data center nito, na nagbibigay ng kumpletong kontrol sa pag-optimize ng modelo ng AI at mas mabilis na pagpapatupad ng pagbabago. Ang diskarte na pinondohan ng sarili na ito ay nagpapaganda ng kakayahang umangkop at bilis ng paggawa ng desisyon. Ang kumpanya ay nakakaakit din ng nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na ang pag -recruit mula sa nangungunang unibersidad ng Tsino.

Habang ang paunang $ 6 milyong gastos sa pagsasanay sa pagsasanay sa Deepseek ay tila hindi makatotohanang-na tinutukoy lamang sa paggamit ng GPU na paggamit ng GPU at hindi kasama ang iba pang mga gastos-ang kumpanya ay namuhunan ng higit sa $ 500 milyon sa pag-unlad ng AI. Ang compact na istraktura nito ay nagbibigay -daan para sa mahusay na pagpapatupad ng pagbabago, na kaibahan sa burukrasya ng mga mas malalaking korporasyon.

Ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng mahusay na pinondohan na independiyenteng mga kumpanya ng AI upang makipagkumpetensya sa mga higanteng industriya. Habang ang mga "rebolusyonaryong badyet" na pag -angkin nito ay pinalaki, ang bilyun -bilyong pamumuhunan, mga pambihirang tagumpay sa teknolohiya, at malakas na koponan ay hindi maikakaila mga kadahilanan sa tagumpay nito. Ang kaibahan ay kapansin -pansin kapag isinasaalang -alang ang mga gastos sa katunggali; Ang Deepseek ay gumugol ng $ 5 milyon sa R1, habang ang ChatGPT4 ay nagkakahalaga ng $ 100 milyon. Sa kabila ng makabuluhang pamumuhunan, ang mga gastos sa Deepseek ay nananatiling mas mababa kaysa sa mga katunggali nito.

Pagsubok sa DeepseekDeepseek v3DeepseekDeepseek