Dom Aktualności Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Autor : Joseph Aktualizacja : Mar 16,2025

Nowy chatbot Deepseek ma imponujące wprowadzenie: „Cześć, zostałem stworzony, abyś mógł zapytać wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”. Ta sztuczna inteligencja, produkt chińskiego startupu Deepseek, szybko stał się głównym graczem rynkowym, nawet przyczyniając się do znacznego spadku ceny akcji NVIDIA. Jego sukces wynika z unikalnej metodologii architektury i szkoleń, obejmujących kilka innowacyjnych technologii.

Prognozowanie wielu tokenów (MTP): W przeciwieństwie do tradycyjnej prognozy słowa, MTP prognozuje wiele słów jednocześnie, analizując różne części zdań pod kątem lepszej dokładności i wydajności.

Mieszanka ekspertów (MOE): Architektura ta wykorzystuje wiele sieci neuronowych do przetwarzania danych wejściowych, przyspieszania szkolenia AI i zwiększania wydajności. Deepseek V3 zatrudnia 256 sieci neuronowych, aktywując osiem dla każdego zadania przetwarzania tokenu.

Utrzymująca uwaga wielowłócona (MLA): Mechanizm ten koncentruje się na kluczowych elementach zdań, wielokrotnie wydobywając kluczowe szczegóły z fragmentów tekstu w celu zminimalizowania utraty informacji i przechwytywania subtelnych niuansów.

Deepseek początkowo twierdził, że wyszkolił swoją potężną sieć neuronową Deepseek V3 za zaledwie 6 milionów dolarów za pomocą GPU 2048. Jednak semianaliza ujawniła znacznie bardziej znaczącą infrastrukturę: około 50 000 GPU Nvidia Hopper, w tym 10 000 H800s, 10 000 H100S i dodatkowych GPU H20, rozprzestrzeniania się na wiele centrów danych. Stanowi to całkowita inwestycja serwerowa w wysokości około 1,6 miliarda USD, a wydatki operacyjne szacują na 944 mln USD.

Deepseek, spółka zależna chińskiego funduszu hedgingowego High-Flyer, jest właścicielem swoich centrów danych, zapewniając pełną kontrolę nad optymalizacją modelu AI i szybszą wdrażanie innowacji. To samofinansowane podejście zwiększa elastyczność i szybkość podejmowania decyzji. Firma przyciąga również najlepsze talenty, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie, przede wszystkim rekrutujące się z wiodących chińskich uniwersytetów.

Podczas gdy początkowe roszczenie o wartości 6 milionów dolarów w wysokości 6 milionów dolarów wydaje się nierealistyczne-odnoszące się jedynie do korzystania z GPU przed treningiem i wykluczaniu innych wydatków-firma zainwestowała ponad 500 milionów dolarów w rozwój AI. Jego kompaktowa struktura pozwala na skuteczne wdrożenie innowacji, kontrastując z biurokracją większych korporacji.

Sukces Deepseek pokazuje potencjał dobrze finansowanych niezależnych firm AI do konkurowania z gigantami branżowymi. Podczas gdy jego „rewolucyjne budżet” roszczenia są przesadzone, jego miliardy inwestycji, przełom technologicznych i silnym zespołem są niezaprzeczalne czynniki w swoim sukcesie. Kontrast jest uderzający przy rozważaniu kosztów konkurencji; Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4 kosztował 100 milionów dolarów. Pomimo znacznych inwestycji koszty Deepseek pozostają znacznie niższe niż jego konkurenci.

Test DeepseekDeepseek v3DeepseekDeepseek