DeepSeek da China treina R1 AI com tecnologia Nvidia por apenas US$ 294 mil: veja o que isso significa

DeepSeek da China treina R1 AI com tecnologia Nvidia por apenas US$ 294 mil: veja o que isso significa
Devesh Kumar
19 de set. de 2025, 00:33 AM
  • O R1 da DeepSeek foi treinado por US$ 294 mil em 512 GPUs Nvidia H800, desafiando as dispendiosas normas ocidentais de IA.
  • O design de código aberto com métodos inspirados na Lhama gera debate sobre ética e desempenho.
  • China apoia chips Huawei e Cambricon à medida que o setor de IA se adapta às restrições de exportação dos EUA.

A DeepSeek da China acabou de sacudir o mundo da IA ao revelar que treinou seu novo modelo R1 por US $ 294.000, uma fração dos custos de dar água nos olhos vistos no Ocidente.

Este movimento não é apenas sobre dólares; ele coloca o DeepSeek no centro de uma revolução de IA generativa, onde a acessibilidade encontra o desempenho de ponta e a hierarquia global está repentinamente em fluxo.

O projeto de IA esmagador de custos da DeepSeek: o que isso significa?

A história por trás do último salto do DeepSeek é notável.

Lançado em um artigo da Nature revisado por pares esta semana, o DeepSeek revelou que o treinamento de seu modelo R1 "centrado no raciocínio" custou apenas US $ 294.000, um contraste impressionante com a OpenAI e o Google, cujos esforços podem chegar a centenas de milhões.

A equipe baseada em Hangzhou contou com 512 GPUs H800 da Nvidia, um chip compatível com a China projetado para exportação durante as restrições tecnológicas dos EUA, e usou técnicas como destilação, onde o modelo aprende com as saídas de IAs existentes para extrair o valor máximo de cada hora de GPU.

Código aberto em sua essência e projetado para eficiência, o regime de treinamento do R1 incluía elementos coletados de modelos como o Llama da Meta, ampliando seu desempenho e a controvérsia em torno de seus métodos.

O resultado? Um modelo que rivaliza com LLMs americanos muito mais caros, todos produzidos sob a nuvem de restrições rígidas de chips e concorrência sempre vigilante.

O molho secreto do DeepSeek parece ser uma mistura de agilidade técnica e prontidão para ultrapassar limites, mesmo quando críticos e rivais globais questionam a abordagem e debatem a ética de "destilar" o conhecimento dos gigantes da IA.

Com o fundador Liang Wenfeng ainda nos bastidores, a divulgação da DeepSeek é tanto um sinal de mercado quanto um comunicado à imprensa: a equação de valor na IA está mudando rapidamente.

A corrida da IA da China em um mundo em mudança

As implicações do feito do DeepSeek são muito mais profundas do que os círculos de tecnologia.

Ele chega no momento em que a China aperta os parafusos da Nvidia, proibindo as principais empresas de tecnologia domésticas de usar o hardware avançado de IA da fabricante de chips americana e suporte rápido para campeões locais como Huawei e Cambricon.

Perdendo o acesso aos melhores chips da Nvidia, o setor de IA da China está mudando para processadores domésticos, um imenso desafio, mas que está começando a entregar resultados reais à medida que a Cambricon registra lucros recordes e os chips Ascend da Huawei se movem para data centers de primeira linha.

Para os investidores americanos e globais, o choque é real: o avanço de baixo custo da DeepSeek eliminou centenas de bilhões do valor da Nvidia em um único dia e reacendeu os debates sobre propriedade intelectual, vantagem nacional e o futuro da inovação de código aberto.

À medida que as ambições de Pequim colidem com as paredes comerciais dos EUA, o modelo de US$ 294.000 da DeepSeek é um lembrete alto de que o próximo salto na IA pode ser tanto sobre eficiência e engenhosidade quanto sobre músculo bruto ou poder de compra.