Hogar Noticias La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Autor : Joseph Actualizar : Mar 16,2025

El nuevo chatbot de Deepseek cuenta con una introducción impresionante: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta IA, un producto de la startup china Deepseek, se ha convertido rápidamente en un importante jugador del mercado, incluso contribuyendo a una caída significativa en el precio de las acciones de Nvidia. Su éxito proviene de una metodología única de arquitectura y capacitación, que incorpora varias tecnologías innovadoras.

Predicción de múltiples token (MTP): a diferencia de la predicción tradicional de palabras por palabra, MTP pronostica múltiples palabras simultáneamente, analizando diferentes piezas de oraciones para mejorar la precisión y la eficiencia.

Mezcla de expertos (MOE): esta arquitectura utiliza múltiples redes neuronales para procesar datos de entrada, acelerar la capacitación de IA y mejorar el rendimiento. Deepseek V3 emplea 256 redes neuronales, activando ocho para cada tarea de procesamiento de tokens.

Atención latente múltiple (MLA): este mecanismo se centra en elementos de oraciones cruciales, extrayendo repetidamente detalles clave de fragmentos de texto para minimizar la pérdida de información y capturar matices sutiles.

Inicialmente, Deepseek afirmó haber entrenado su poderosa red neuronal de Deepseek V3 por solo $ 6 millones utilizando 2048 GPU. Sin embargo, el semianálisis reveló una infraestructura mucho más sustancial: aproximadamente 50,000 GPU de la tolva Nvidia, incluidas 10,000 H800, 10,000 H100 y GPU H20 adicionales, se extienden entre múltiples centros de datos. Esto representa una inversión de servidor total de aproximadamente $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones.

Deepseek, una subsidiaria del Fondo de cobertura chino High-Flyer, posee sus centros de datos, proporcionando un control completo sobre la optimización del modelo de IA y la implementación de innovación más rápida. Este enfoque autofinanciado mejora la flexibilidad y la velocidad de toma de decisiones. La compañía también atrae al máximo talento, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente reclutando de las principales universidades chinas.

Si bien el reclamo inicial de costo de capacitación de $ 6 millones de Deepseek parece poco realista, solo para referir solo al uso previo al uso de la GPU y excluyendo otros gastos, la compañía ha invertido más de $ 500 millones en desarrollo de IA. Su estructura compacta permite una implementación de innovación eficiente, en contraste con la burocracia de corporaciones más grandes.

El éxito de Deepseek muestra el potencial de las compañías de IA independientes bien financiadas para competir con los gigantes de la industria. Si bien sus reclamos de "presupuesto revolucionario" son exagerados, sus miles de millones en inversión, avances tecnológicos y un equipo fuerte son factores innegables en su éxito. El contraste es sorprendente al considerar los costos de la competencia; Deepseek gastó $ 5 millones en R1, mientras que ChatGPT4 costó $ 100 millones. A pesar de la importante inversión, los costos de Deepseek siguen siendo significativamente más bajos que sus competidores.

Prueba de SpeeekDeepseek v3VeteranoVeterano