DeepSeek de China entrena a R1 AI con tecnología Nvidia por solo $ 294K: esto es lo que significa

DeepSeek de China entrena a R1 AI con tecnología Nvidia por solo $ 294K: esto es lo que significa
Devesh Kumar
19 sept 2025, 05:33 A. M.
  • El R1 de DeepSeek se entrenó por $ 294K en 512 GPU Nvidia H800, desafiando las costosas normas occidentales de IA.
  • El diseño de código abierto con métodos inspirados en Llama genera un debate sobre la ética y el rendimiento.
  • China respalda los chips Huawei y Cambricon mientras el sector de la IA se adapta a las restricciones de exportación de EE. UU.

DeepSeek de China acaba de sacudir el mundo de la IA al revelar que entrenó su nuevo modelo R1 por la asombrosa cifra de 294.000 dólares, una fracción de los costos desorbitados que se ven en Occidente.

Este movimiento no se trata solo de dólares; coloca a DeepSeek en el corazón de una revolución de IA generativa, donde la asequibilidad se encuentra con el rendimiento de vanguardia y el orden jerárquico global está cambiando repentinamente.

Proyecto de IA de DeepSeek: ¿Qué significa?

La historia detrás del último salto de DeepSeek es notable.

Publicado en un artículo de Nature revisado por pares esta semana, DeepSeek reveló que entrenar su modelo R1 "centrado en el razonamiento" costó solo $ 294,000, un contraste sorprendente con OpenAI y Google, cuyos esfuerzos pueden ascender a cientos de millones.

El equipo con sede en Hangzhou se basó en 512 de las GPU H800 de Nvidia, un chip compatible con China diseñado para la exportación durante las restricciones tecnológicas de EE. UU., y utilizó técnicas como la destilación, donde el modelo aprende de los resultados de las IA existentes para exprimir el máximo valor de cada hora de GPU.

De código abierto en su núcleo y diseñado para la eficiencia, el régimen de entrenamiento de R1 incluía elementos extraídos de modelos como Llama de Meta, amplificando tanto su rendimiento como la controversia que rodea a sus métodos.

¿El resultado? Un modelo que rivaliza con los LLM estadounidenses mucho más caros, todos producidos bajo la nube de estrictas restricciones de chips y una competencia siempre vigilante.

La salsa secreta de DeepSeek parece ser una mezcla de agilidad técnica y disposición para superar los límites, incluso cuando los críticos y los rivales globales cuestionan el enfoque y debaten la ética de "destilar" el conocimiento de los gigantes de la IA.

Con el fundador Liang Wenfeng todavía en su mayor parte detrás de escena, la divulgación de DeepSeek es tanto una señal de mercado como un comunicado de prensa: la ecuación de valor en IA está cambiando rápidamente.

La carrera de IA de China en un mundo cambiante

Las implicaciones de la hazaña de DeepSeek son mucho más profundas que los círculos tecnológicos.

Llega justo cuando China aprieta las tuercas a Nvidia, emitiendo una prohibición para que las principales empresas tecnológicas nacionales utilicen el hardware de inteligencia artificial avanzado del fabricante de chips estadounidense y el soporte de vía rápida para campeones locales como Huawei y Cambricon.

Al perder el acceso a los mejores chips de Nvidia, el sector de IA de China está cambiando a procesadores de cosecha propia, un desafío inmenso, pero que está comenzando a ofrecer resultados reales a medida que Cambricon registra ganancias récord y los chips Ascend de Huawei se trasladan a centros de datos de primer nivel.

Para los inversores estadounidenses y globales, el impacto es real: el avance de bajo costo de DeepSeek borró cientos de miles de millones del valor de Nvidia en un solo día y reavivó los debates sobre la propiedad intelectual, la ventaja nacional y el futuro de la innovación de código abierto.

A medida que las ambiciones de Beijing chocan con los muros comerciales de EE. UU., el modelo de $ 294,000 de DeepSeek es un fuerte recordatorio de que el próximo salto en IA puede tener tanto que ver con la eficiencia y el ingenio como con el músculo bruto o el poder adquisitivo.