Nvidia revela Nemotron 3: por que a NVDA está tornando seus modelos de IA mais recentes open source?

Nvidia revela Nemotron 3: por que a NVDA está tornando seus modelos de IA mais recentes open source?
Devesh Kumar
15 de dez. de 2025, 12:26 PM
  • A Nvidia lançou agora o Nemotron 3 Nano, com modelos maiores Super e Ultra planejados para o início de 2026.
  • A versão aberta inclui pesos de modelos, conjuntos de dados e ferramentas de treinamento sob a Licença de Modelo Aberto da NVIDIA.
  • A medida tem como alvo a demanda de empresas e governos por alternativas auditáveis e de IA on-premiss.

A Nvidia anunciou na segunda-feira a família Nemotron 3 de modelos de IA lançados abertamente, conjuntos de dados de treinamento e bibliotecas de engenharia.

Isso marca um avanço agressivo para o desenvolvimento de IA de código aberto.

A medida sinaliza a intenção da Nvidia de dominar não apenas a camada de hardware da inteligência artificial, mas também as camadas de software e modelo.

O desenvolvimento ocorre em meio a empresas do mundo todo buscando alternativas domésticas e auditáveis a sistemas de IA fechados ou estrangeiros.

O lançamento inclui pesos de modelo, um corpus sintético de pré-treinamento de quase 10 trilhões de tokens e receitas detalhadas de treinamento sob uma licença aberta.

Ele permite que desenvolvedores e empresas inspecionem, personalizem e implantem modelos Nemotron em sua própria infraestrutura.

O cálculo estratégico é transparente, já que a IA de código aberto se espalha globalmente.

Com as agências governamentais dos EUA exigindo transparência, a Nvidia está se posicionando como o fornecedor doméstico de confiança, ao mesmo tempo em que fortalece seu ecossistema de desenvolvedores.

O que a Nvidia lançou: Modelos, dados e alegações técnicas

A família Nemotron 3 consiste em três modelos em tamanhos crescentes: Nano (30 bilhões de parâmetros com 3 bilhões ativos), Super (100 bilhões com 10 bilhões ativos) e Ultra (500 bilhões com 50 bilhões ativos).

Apenas o Nemotron 3 Nano é enviado imediatamente; Super e Ultra chegam na primeira metade de 2026.

A principal afirmação da Nvidia é eficiência. O Nemotron 3 Nano entrega quatro vezes mais throughput do seu antecessor Nemotron 2 e reduz a geração de tokens de raciocínio em até 60%.

Os modelos empregam uma arquitetura híbrida de mistura latente de especialistas, um design que ativa apenas os caminhos computacionais mais relevantes para cada tarefa, imitando como o cérebro humano compartimentaliza o trabalho.

Essa abordagem se tornou o padrão da indústria, com os 10 modelos open-source mais inteligentes agora usando o MoE, segundo dados de benchmarking independente.

Vale ressaltar que a quantidade de informações que um modelo pode armazenar na memória aumenta para um milhão de tokens para o Nano, sete vezes maior que seu antecessor.

Isso importa para documentos longos, repositórios de código e raciocínio complexo em múltiplas etapas.

Super e Ultra aproveitam o formato de treinamento NVFP4 de 4 bits da Nvidia em seu hardware Blackwell, reduzindo os requisitos de memória e o tempo de treinamento sem sacrificar a precisão.

Todos os pesos dos modelos, corpora de treinamento e receitas detalhadas estão disponíveis no GitHub e Hugging Face sob a Licença de Modelo Aberto da NVIDIA.

Os desenvolvedores também têm acesso ao NeMo Gym, NeMo RL e NeMo Evaluator, as bibliotecas de código aberto para treinamento, aprendizado por reforço e validação de segurança.

Por que abrir a questão de liberação?

O lançamento aberto responde diretamente à crescente demanda empresarial por transparência de modelos.

"Muitos de nossos clientes corporativos não conseguem implantar certos modelos ou construir seus negócios sobre modelos com códigos-fonte opacos", disse Kari Briski, vice-presidente de software de IA generativa da Nvidia.

Setores regulados como saúde, finanças e defesa exigem alternativas auditáveis e on-premises em relação a sistemas proprietários controlados por entidades estrangeiras.

A decisão da Nvidia ganha força à medida que a Meta recua do código aberto. O crescimento da Llama estagnou após o lançamento morno do Llama 4 em abril, cedendo espaço para modelos rivais abertos.

A Meta reteve conjuntos de dados de treinamento até mesmo de parceiros próximos como a Nvidia, limitando melhorias impulsionadas pela comunidade.

Em contraste, a Nvidia publica tudo: pesos, receitas e conjuntos de dados. Essa transparência poderia atrair clientes corporativos e contratos governamentais desconfiados de dependências opacas.

Geopoliticamente, tarifas e restrições de exportação dos EUA sobre IA chinesa amplificam a vantagem da Nvidia.