Deepseek'in karşılanabilirliği bir efsanedir: Devrimci AI aslında 1,6 milyar dolara mal oldu
Deepseek'in yeni sohbet botu etkileyici bir tanıtımla övünüyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Çin girişiminin bir ürünü olan bu AI, hızla önemli bir pazar oyuncusu haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulundu. Başarısı, çeşitli yenilikçi teknolojileri içeren eşsiz bir mimari ve eğitim metodolojisinden kaynaklanmaktadır.
Çoklu Tahmini Tahmin (MTP): Geleneksel kelime tahmininin aksine, MTP aynı anda birden fazla kelimeyi tahmin ederek, iyileştirilmiş doğruluk ve verimlilik için farklı cümle parçalarını analiz eder.
Uzmanların Karışımı (MOE): Bu mimari, girdi verilerini işlemek, AI eğitimini hızlandırmak ve performansı arttırmak için birden fazla sinir ağını kullanır. Deepseek V3, her bir jeton işleme görevi için sekiz'i etkinleştiren 256 sinir ağı kullanır.
Çok Baş Gizli Dikkat (MLA): Bu mekanizma, bilgi kaybını en aza indirmek ve ince nüansları yakalamak için metin parçalarından önemli ayrıntıları tekrar tekrar çıkararak önemli cümle öğelerine odaklanır.
Deepseek başlangıçta güçlü Deepseek V3 sinir ağını 2048 GPU kullanarak sadece 6 milyon dolarlık eğittiğini iddia etti. Bununla birlikte, semianaliz çok daha önemli bir altyapı ortaya çıkarmıştır: 10.000 H800, 10.000 H100s ve ek H20 GPU dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları birden fazla veri merkezine yayılmıştır. Bu, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel giderlerin 944 milyon dolar olduğu tahmin edilmektedir.
Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, AI modeli optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlayan veri merkezlerinin sahibidir. Bu kendi kendine finanse edilen yaklaşım esnekliği ve karar verme hızını artırır. Şirket ayrıca en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1,3 milyon doların üzerinde kazanıyor ve öncelikle önde gelen Çin üniversitelerinden işe alıyor.
Deepseek'in ilk 6 milyon dolarlık eğitim maliyet talebi gerçekçi görünmese de-yalnızca GPU kullanımının öncesi eğitimine ve diğer masrafları hariç tutmaya referans vermek-şirket AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Kompakt yapısı, daha büyük şirketlerin bürokrasisi ile tezat oluşturan verimli inovasyon uygulamasına izin verir.
Deepseek'in başarısı, iyi finanse edilen bağımsız AI şirketlerinin endüstri devleriyle rekabet etme potansiyelini sergiliyor. "Devrimci bütçe" iddiaları abartılı olsa da, milyarlarca yatırım, teknolojik atılımlar ve güçlü ekip, başarısında yadsınamaz faktörlerdir. Rakip maliyetleri düşünürken kontrast dikkat çekicidir; Deepseek R1'e 5 milyon dolar, ChatGPT4'ün maliyeti 100 milyon dolara mal oldu. Önemli yatırımlara rağmen, Deepseek'in maliyetleri rakiplerinden önemli ölçüde daha düşüktür.