訊息 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Joseph 更新 : Mar 16,2025

DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要市場參與者,甚至導致NVIDIA的股價大幅下降。它的成功源於一種獨特的建築和培訓方法,並結合了幾種創新技術。

多語預測(MTP):與傳統的單詞預測不同,MTP同時預測多個單詞,分析不同的句子以提高準確性和效率。

專家(MOE)的混合:該體系結構利用多個神經網絡來處理輸入數據,加速AI訓練並增強性能。 DeepSeek V3使用256個神經網絡,為每個令牌處理任務激活8個。

多頭潛在註意力(MLA):這種機制著重於關鍵的句子元素,反復從文本片段中提取關鍵細節,以最大程度地減少信息丟失並捕獲細微的細微差別。

DeepSeek最初聲稱使用2048 GPU培訓了其強大的DeepSeek V3神經網絡,僅需600萬美元。但是,半分析顯示出更大的基礎設施:大約50,000個NVIDIA HOPPER GPU,包括10,000 H800,10,000 H100和其他H20 GPU,分佈在多個數據中心。這代表了一筆總額約16億美元的服務器投資,運營費用估計為9.44億美元。

DeepSeek是中國對沖基金高飛行員的子公司擁有其數據中心,可完全控制AI模型優化和更快的創新實施。這種自資助的方法提高了靈活性和決策速度。該公司還吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要是從領先的中國大學招募。

儘管DeepSeek最初的600萬美元培訓成本索賠似乎是不現實的,但僅引用了預培訓的GPU使用和排除其他費用,但該公司已在AI開發方面投資了超過5億美元。它的緊湊結構允許有效的創新實施,與大公司的官僚機構形成鮮明對比。

DeepSeek的成功展示了資金充足的獨立AI公司與行業巨頭競爭的潛力。儘管其“革命預算”主張被誇大了,但其數十億美元的投資,技術突破和強大的團隊是其成功的不可否認的因素。在考慮競爭對手成本時,對比是顯著的。 DeepSeek在R1上花費了500萬美元,而Chatgpt4的費用為1億美元。儘管進行了巨大的投資,但DeepSeek的成本仍大大低於其競爭對手。

DeepSeek測試DeepSeek V3DeepSeekDeepSeek