Skip to content

Nvidia Acabou de Redefinir o Futuro da IA

A Nvidia acabou de lançar quatro grandes novidades na GTC Taipei, revelando um novo modelo open-source radical e uma CPU construída inteiramente para agentes de IA. Estas atualizações sinalizam uma reformulação completa da computação, desde os data centers até o PC na sua mesa.

Stork.AI
Hero image for: Nvidia Acabou de Redefinir o Futuro da IA

Resumo / Pontos-chave

A Nvidia acabou de lançar quatro grandes novidades na GTC Taipei, revelando um novo modelo open-source radical e uma CPU construída inteiramente para agentes de IA. Estas atualizações sinalizam uma reformulação completa da computação, desde os data centers até o PC na sua mesa.

Nemotron 3: A Aposta Open-Source da Nvidia

A Nvidia revelou o Nemotron 3 Ultra, um monumental modelo de IA open-source. Este gigante possui 550 bilhões de parâmetros totais, com até 55 bilhões ativos por token, construído sobre uma arquitetura híbrida inovadora Mamba (SSM) e Transformer Mixture-of-Experts (MoE). Esta combinação única oferece velocidade de processamento excepcional, estabelecendo um novo padrão para a eficiência de modelos.

A Nvidia demonstra um profundo compromisso com o desenvolvimento de IA aberta com o Nemotron 3 Ultra. Ao contrário de outros modelos, a Nvidia fornece um pacote open-source verdadeiramente abrangente, lançando: - Model weights - Training scripts - Full dataset Esta transparência sem precedentes permite que desenvolvedores em todo o mundo inspecionem, desenvolvam e personalizem livremente o modelo, promovendo a inovação em toda a comunidade de IA.

Jensen Huang destacou o desempenho transformador do Nemotron 3 Ultra. Ele declarou que ele roda 5x mais rápido e é 30% mais barato para inferência do que os melhores modelos abertos do mundo, mesmo os mais econômicos. Este salto arquitetônico permite que agentes de IA executem tarefas mais complexas e de maior duração pelo mesmo custo, permitindo-lhes efetivamente "pensar por mais tempo" e mais profundamente dentro dos orçamentos existentes.

Vera: A CPU Construída Para o Seu Assistente de IA

CPUs tradicionais apresentam um gargalo significativo para a IA, particularmente dentro do 'ciclo agentic' onde uma CPU deve gerenciar e alimentar dados eficientemente para GPUs poderosas. Esta arquitetura tradicional, projetada para uma era diferente, impede diretamente a utilização da GPU, estrangulando o throughput de tokens, aumentando a latência e degradando a experiência do usuário em aplicações de IA sofisticadas.

A Nvidia revelou a Vera, uma CPU construída especificamente para a era dos agentes. No seu núcleo reside o Olympus Core personalizado, projetado para cargas de trabalho de data center modernas, como runtimes Python com muitas ramificações e execução de código em sandbox. Uma malha de coerência escalável unifica todos os 88 núcleos Olympus em uma malha monolítica, permitindo uma comunicação núcleo a núcleo 50% mais rápida do que os designs tradicionais de chiplets. A Vera também é a primeira CPU a integrar memória LPDDR5X, oferecendo 40% menor latência de pico de memória em comparação com x86, crucial para a recuperação e análise oportuna de dados.

A Vera oferece 1.8 vezes o desempenho de sandbox agentic das CPUs x86. Este aumento substancial se traduz diretamente em maior throughput de tokens e uma experiência de usuário superior para aplicações de IA complexas. Fortemente acoplada com Rubin GPUs via conexões chip-a-chip NVLink com coerência de memória, a Vera garante fluxos de trabalho acelerados. A Vera BlueField 4 STX impulsiona ainda mais a memória de contexto e o armazenamento de IA, fornecendo uma solução completa de computação, rede e armazenamento para a era dos agentes.

Cosmos 3: A IA Que Entende a Realidade

A Nvidia revelou o Cosmos 3, um modelo de mundo omnimodal projetado para redefinir a Physical AI. Este sistema fundamental concede a robôs e veículos autônomos uma compreensão profunda do mundo físico, processando uma rica tapeçaria de dados: vídeo, som, texto e entradas de ações críticas. Ele estabelece uma percepção robusta e holística da realidade para agentes inteligentes.

Cosmos 3 opera em uma escala sem precedentes, treinado com impressionantes 20 trilhões de tokens de dados multimodais. Seu corpus de treinamento abrange quase 4 bilhões de imagens, 400 milhões de vídeos reais e sintéticos, juntamente com vastos conjuntos de dados de som, texto e ação. Isso capacita o Cosmos 3 a transcender a mera observação; ele produz ativamente "action data", permitindo que os sistemas prevejam resultados e tomem decisões sofisticadas. Essa abordagem inovadora unifica perfeitamente os modelos de mundo tradicionais e os modelos de ação em uma estrutura singular e poderosa.

A Nvidia reforça seu compromisso com a inovação aberta ao tornar o Cosmos 3 um modelo aberto. Desenvolvedores podem acessar facilmente seus pesos no Hugging Face e o código-fonte completo no GitHub. Isso democratiza o acesso a um poderoso ponto de partida para avanços em robótica, simulações complexas e sistemas autônomos, acelerando diretamente a revolução mais ampla da IA física. Para obter insights mais aprofundados sobre o ecossistema de IA agentic da Nvidia, incluindo a Vera CPU, consulte NVIDIA Unveils Vera, the CPU for Agents.

Seu Próximo PC é um Agente de IA

A Nvidia e a Microsoft estão em parceria para "reinventar o PC pela primeira vez em 40 anos", introduzindo o inovador superchip RTX Spark. Esta colaboração marca uma mudança profunda, transformando o computador pessoal de um dispositivo que meramente executa aplicativos em um que hospeda e executa agentes de IA nativos de forma contínua. Esta iniciativa redefine fundamentalmente a experiência do usuário e o próprio propósito da computação pessoal.

As especificações do Spark são nada menos que monstruosas, projetadas para capacidades de IA local incomparáveis. Um único chip funde uma poderosa Blackwell RTX GPU, ostentando imensos 6.144 CUDA cores, com uma Grace CPU personalizada de 20 núcleos. Esta potência integrada oferece um impressionante um petaFLOP de desempenho de IA, tudo apoiado por uma enorme 128GB de unified memory, eliminando gargalos de dados tradicionais e permitindo tarefas complexas de IA.

Futuros PCs executarão IAs pessoais de forma contínua e segura, operando inteiramente dentro de um ambiente de sandbox local diretamente no dispositivo. Isso garante privacidade robusta e funcionalidade sempre ativa para usuários individuais, capacitando-os com assistência inteligente sem depender da nuvem. O RTX Spark fornece a base de hardware essencial para uma nova plataforma Windows, construída especificamente para permitir essa profunda mudança de paradigma em direção à computação pessoal pervasiva e agentic.

Perguntas Frequentes

O que é Nvidia Nemotron 3 Ultra?

Nemotron 3 Ultra é o novo modelo de linguagem grande, completamente de código aberto da Nvidia, com 550 bilhões de parâmetros. Ele é projetado para ser 5x mais rápido e 30% mais barato de executar do que modelos abertos comparáveis.

Por que a Nvidia criou a Vera CPU?

A Nvidia criou a Vera CPU especificamente para a 'era dos agentes'. Ela é projetada para eliminar o gargalo de desempenho das CPUs tradicionais em fluxos de trabalho de IA, atuando como um condutor para tarefas intensivas em GPU.

Para que serve o Nvidia Cosmos 3?

Cosmos 3 é um modelo de fundação aberto para 'physical AI'. Ele ajuda robôs, carros autônomos e outros sistemas físicos a entender, prever e agir no mundo real usando dados multimodais.

O que é RTX Spark?

RTX Spark é um novo 'superchip' desenvolvido pela Nvidia e Microsoft para reinventar o PC para a era da IA. Ele combina uma poderosa Blackwell RTX GPU e uma Grace CPU para executar agentes de IA sofisticados localmente em seu computador.

One weekly email of tools worth shipping. No drip funnel.

one email per week · unsubscribe in two clicks · no third-party tracking

🚀Descubra mais

Fique à frente da curva da IA

Descubra as melhores ferramentas de IA, agentes e servidores MCP selecionados pela Stork.AI.

P.S. Criou algo que vale a pena? Liste no Stork

Voltar a todas as publicações