Nvidia presenta Nemotron 3: ¿por qué NVDA está haciendo que sus últimos modelos de IA sean de código abierto?

Nvidia presenta Nemotron 3: ¿por qué NVDA está haciendo que sus últimos modelos de IA sean de código abierto?
Devesh Kumar
15 dic 2025, 16:26 P. M.
  • Nvidia ha lanzado ahora el Nemotron 3 Nano, con modelos Super y Ultra más grandes previstos para principios de 2026.
  • La versión abierta incluye pesos de modelo, conjuntos de datos y herramientas de entrenamiento bajo la Licencia de Modelo Abierto de NVIDIA.
  • La medida se dirige a la demanda tanto empresarial como gubernamental de alternativas de IA auditables y locales.

Nvidia anunció el lunes la familia Nemotron 3 de modelos de IA publicados abiertamente, conjuntos de datos de entrenamiento y bibliotecas de ingeniería.

Esto supone un impulso agresivo hacia el desarrollo de IA de código abierto.

Esta medida señala la intención de Nvidia de dominar no solo la capa de hardware de la inteligencia artificial, sino también las capas de software y modelos.

Este desarrollo se produce en medio de empresas de todo el mundo que buscan alternativas nacionales y auditables a sistemas de IA cerrados o extranjeros.

La versión incluye pesos de modelo, un corpus sintético de preentrenamiento de casi 10 billones de tokens y recetas de entrenamiento detalladas bajo una licencia abierta.

Permite a desarrolladores y empresas inspeccionar, personalizar y desplegar modelos de Nemotron en su propia infraestructura.

El cálculo estratégico es transparente, ya que la IA de código abierto se expande a nivel global.

Con las agencias gubernamentales en Estados Unidos exigiendo transparencia, Nvidia se posiciona como el proveedor nacional de confianza, al tiempo que fortalece su ecosistema de desarrolladores.

Lo que Nvidia publicó: Modelos, datos y afirmaciones técnicas

La familia Nemotron 3 consta de tres modelos en tamaños crecientes: Nano (30 mil millones de parámetros con 3 mil millones activos), Super (100 mil millones con 10 mil millones activos) y Ultra (500 mil millones con 50 mil millones activos).

Solo el Nemotron 3 Nano se lanza inmediatamente; Super y Ultra llegan en la primera mitad de 2026.

La afirmación principal de Nvidia es la eficiencia. Nemotron 3 Nano ofrece cuatro veces el rendimiento de su predecesor Nemotron 2 y reduce la generación de tokens de razonamiento hasta en un 60%.

Los modelos emplean una arquitectura híbrida latente de mezclas de expertos, un diseño que activa solo las vías computacionales más relevantes para cada tarea, imitando cómo el cerebro humano compartimenta el trabajo.

Este enfoque se ha convertido en el estándar de la industria, con los 10 modelos de código abierto más inteligentes que ahora utilizan el MoE, según datos de benchmarking independientes.

Cabe señalar que la cantidad de información que un modelo puede almacenar en memoria se expande hasta un millón de tokens para Nano, siete veces más que su predecesor.

Eso importa para documentos de formato largo, repositorios de código y razonamientos complejos de varios pasos.

Super y Ultra aprovechan el formato de entrenamiento NVFP4 de 4 bits de Nvidia en su hardware Blackwell, reduciendo los requisitos de memoria y el tiempo de entrenamiento sin sacrificar precisión.

Todos los pesas de modelo, corpus de entrenamiento y recetas detalladas están disponibles en GitHub y Hugging Face bajo la Licencia de Modelo Abierto de NVIDIA.

Los desarrolladores también tienen acceso a NeMo Gym, NeMo RL y NeMo Evaluator, las librerías de código abierto para entrenamiento, aprendizaje por refuerzo y validación de seguridad.

¿Por qué abrir la materia de liberación?

La versión abierta responde directamente a la creciente demanda empresarial de transparencia en el modelo.

"Muchos de nuestros clientes empresariales no pueden desplegar ciertos modelos ni construir su negocio sobre modelos con códigos fuente opacos", dijo Kari Briski, vicepresidenta de software de IA generativa de Nvidia.

Industrias reguladas como la sanidad, las finanzas y la defensa requieren alternativas auditables y locales a los sistemas propietarios controlados por entidades extranjeras.

La medida de Nvidia gana fuerza a medida que Meta se retira del código abierto. El crecimiento de Llama se estancó tras el tibio lanzamiento de Llama 4 en abril, cediendo terreno a modelos abiertos rivales.

Meta ha retenido conjuntos de datos de entrenamiento incluso a socios cercanos como Nvidia, limitando las mejoras impulsadas por la comunidad.

En cambio, Nvidia publica todo: pesos, recetas y conjuntos de datos. Esa transparencia podría atraer a clientes empresariales y contratos gubernamentales recelosos de dependencias opacas.

Geopolíticamente, los aranceles estadounidenses y las restricciones a la exportación de la IA china amplifican la ventaja de Nvidia.