Casa Notizia L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

Autore : Joseph Aggiornamento : Mar 16,2025

Il nuovo chatbot di Deepseek vanta un'impressionante introduzione: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa intelligenza artificiale, un prodotto della startup cinese Deepseek, è diventata rapidamente un importante giocatore di mercato, contribuendo anche a un calo significativo del prezzo delle azioni di Nvidia. Il suo successo deriva da una metodologia di architettura e formazione unica, che incorpora diverse tecnologie innovative.

Previsione multi-token (MTP): a differenza della previsione tradizionale Word-By Word, MTP prevede contemporaneamente più parole, analizzando diverse frasi per una migliore precisione ed efficienza.

Miscela di esperti (MOE): questa architettura utilizza più reti neurali per elaborare i dati di input, accelerare la formazione dell'IA e migliorare le prestazioni. DeepSeek V3 impiega 256 reti neurali, attivando otto per ogni attività di elaborazione dei token.

Attenzione latente multi-testa (MLA): questo meccanismo si concentra su elementi di frase cruciali, estraendo ripetutamente i dettagli chiave dai frammenti di testo per ridurre al minimo la perdita di informazioni e acquisire sottili sfumature.

Deepseek inizialmente ha affermato di aver addestrato la sua potente rete neurale Deepseek V3 per soli $ 6 milioni utilizzando 2048 GPU. Tuttavia, la semianalisi ha rivelato un'infrastruttura molto più sostanziale: circa 50.000 GPU della tramoggia Nvidia, tra cui 10.000 H800, 10.000 H100 e GPU H20 aggiuntive, diffuse su più data center. Ciò rappresenta un investimento in totale server di circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni.

DeepSeek, una consociata dell'hedge fund cinese High-Flyer, possiede i suoi data center, fornendo un controllo completo sull'ottimizzazione del modello AI e l'implementazione più rapida dell'innovazione. Questo approccio autofinanziato migliora la flessibilità e la velocità decisionale. La società attira anche i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente reclutando dalle principali università cinesi.

Mentre la richiesta di costo di formazione iniziale di $ 6 milioni di DeepSeek sembra irrealistica-riferirsi solo all'utilizzo della GPU pre-allenamento ed escluso altre spese-la società ha investito oltre $ 500 milioni in sviluppo dell'IA. La sua struttura compatta consente un'implementazione di innovazione efficiente, in contrasto con la burocrazia di società più grandi.

Il successo di Deepseek mostra il potenziale di società di intelligenza artificiale ben finanziate per competere con i giganti del settore. Mentre le sue affermazioni sul "bilancio rivoluzionario" sono esagerate, i suoi miliardi di investimenti, scoperte tecnologiche e team forte sono fattori innegabili nel suo successo. Il contrasto è sorprendente quando si considerano i costi della concorrenza; DeepSeek ha speso $ 5 milioni in R1, mentre CHATGPT4 costa $ 100 milioni. Nonostante l'investimento significativo, i costi di Deepseek rimangono significativamente inferiori rispetto ai suoi concorrenti.

Test di DeepSeek DeepSeek V3 Deep -Week