Heim Nachricht Die Erschwinglichkeit von Deepseek ist ein Mythos: Die revolutionäre KI kostet tatsächlich 1,6 Milliarden US -Dollar für die Entwicklung

Die Erschwinglichkeit von Deepseek ist ein Mythos: Die revolutionäre KI kostet tatsächlich 1,6 Milliarden US -Dollar für die Entwicklung

Autor : Joseph Aktualisieren : Mar 16,2025

Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Marktspieler geworden und hat sogar zu einem erheblichen Rückgang des NVIDIA -Aktienkurses beigetragen. Der Erfolg beruht auf einer einzigartigen Architektur- und Trainingsmethodik mit mehreren innovativen Technologien.

Multi-Token-Vorhersage (MTP): Im Gegensatz zur herkömmlichen Wort für Wortvorhersage prognostiziert MTP mehrere Wörter gleichzeitig und analysiert verschiedene Satzteile auf verbesserte Genauigkeit und Effizienz.

Mischung von Experten (MOE): Diese Architektur verwendet mehrere neuronale Netze, um Eingabedaten zu verarbeiten, das KI -Training zu beschleunigen und die Leistung zu verbessern. Deepseek V3 verwendet 256 neuronale Netze und aktiviert acht für jede Token -Verarbeitungsaufgabe.

Multi-Head Latent Achtung (MLA): Dieser Mechanismus konzentriert sich auf wichtige Satzelemente und extrahiert wiederholt Schlüsseldetails aus Textfragmenten, um den Informationsverlust zu minimieren und subtile Nuancen zu erfassen.

Deepseek behauptete zunächst, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit 2048 GPUs ausgebildet zu haben. Die semiianalyse ergab jedoch eine weitaus wesentlichere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100s und zusätzlicher H20 -GPUs, verteilt auf mehrere Datenzentren. Dies entspricht einer gesamten Serverinvestition von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten auf 944 Mio. USD geschätzt werden.

Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und bietet die vollständige Kontrolle über AI-Modelloptimierung und eine schnellere Implementierung von Innovationen. Dieser selbstfinanzierte Ansatz verbessert die Flexibilität und Entscheidungsgeschwindigkeit. Das Unternehmen zieht auch Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen und hauptsächlich von führenden chinesischen Universitäten rekrutieren.

Während Deepseeks anfängliche Schulungskostenansprüche in Höhe von 6 Millionen US-Dollar unrealistisch erscheint-sich nur für die Nutzung der GPU vor dem Training vorliegt und andere Ausgaben ausgeschlossen hat, hat das Unternehmen über 500 Millionen US-Dollar in die KI-Entwicklung investiert. Die kompakte Struktur ermöglicht eine effiziente Implementierung von Innovationen, im Gegensatz zur Bürokratie größerer Unternehmen.

Der Erfolg von Deepseek zeigt das Potenzial gut finanzierter unabhängiger KI-Unternehmen, mit Branchenriesen zu konkurrieren. Während seine "revolutionären Haushaltsansprüche" übertrieben sind, sind seine Milliarden an Investitionen, technologischen Durchbrüchen und ein starkes Team unbestreitbare Faktoren für seinen Erfolg. Der Kontrast ist auffällig, wenn die Konkurrenzkosten in Betracht gezogen werden. Deepseek gab 5 Millionen Dollar für R1 aus, während Chatgpt4 100 Millionen US -Dollar kostete. Trotz der erheblichen Investitionen bleiben die Kosten von Deepseek deutlich niedriger als die Wettbewerber.

Deepseek -TestDeepseek v3DeepseekDeepseek