Resumen / Puntos clave
Nemotron 3: La apuesta de código abierto de Nvidia
Nvidia presentó Nemotron 3 Ultra, un monumental modelo de IA de código abierto. Este gigante cuenta con 550 mil millones de parámetros totales, con hasta 55 mil millones activos por token, construido sobre una innovadora arquitectura híbrida Mamba (SSM) y Transformer Mixture-of-Experts (MoE). Esta combinación única ofrece una velocidad de procesamiento excepcional, estableciendo un nuevo referente para la eficiencia del modelo.
Nvidia demuestra un profundo compromiso con el desarrollo de IA de código abierto con Nemotron 3 Ultra. A diferencia de otros modelos, Nvidia proporciona un paquete de código abierto verdaderamente completo, lanzando: - Pesos del modelo - Scripts de entrenamiento - Conjunto de datos completo Esta transparencia sin precedentes permite a los desarrolladores de todo el mundo inspeccionar, construir y personalizar libremente el modelo, fomentando la innovación en toda la comunidad de IA.
Jensen Huang destacó el rendimiento transformador de Nemotron 3 Ultra. Declaró que funciona 5 veces más rápido y un 30% más barato para inferencia que los mejores modelos abiertos del mundo, incluso los más rentables. Este salto arquitectónico permite a los agentes de IA ejecutar tareas más complejas y de mayor duración al mismo costo, permitiéndoles efectivamente "pensar más tiempo" y más profundamente dentro de los presupuestos existentes.
Vera: La CPU construida para su asistente de IA
Las CPU tradicionales presentan un cuello de botella significativo para la IA, particularmente dentro del 'agentic loop' donde una CPU debe gestionar y alimentar datos de manera eficiente a potentes GPU. Esta arquitectura tradicional, diseñada para una era diferente, impide directamente la utilización de la GPU, estrangulando el 'token throughput', aumentando la latencia y degradando la experiencia del usuario en aplicaciones de IA sofisticadas.
Nvidia presentó Vera, una CPU diseñada específicamente para la era de los agentes. En su núcleo se encuentra el Olympus Core personalizado, diseñado para cargas de trabajo de centros de datos modernos como los 'Python runtimes' con muchas ramificaciones y la ejecución de código en 'sandbox'. Un tejido de coherencia escalable unifica los 88 núcleos Olympus en una malla monolítica, lo que permite una comunicación de núcleo a núcleo un 50% más rápida que los diseños de 'chiplet' tradicionales. Vera es también la primera CPU en integrar memoria LPDDR5X, ofreciendo un 40% menos de latencia máxima de memoria en comparación con x86, crucial para la recuperación oportuna de datos y el análisis.
Vera ofrece 1.8 veces el agentic sandbox performance de las CPU x86. Este impulso sustancial se traduce directamente en un mayor 'token throughput' y una experiencia de usuario superior para aplicaciones de IA complejas. Estrechamente acoplada con las GPU Rubin a través de conexiones 'chip-to-chip' NVLink con coherencia de memoria, Vera garantiza flujos de trabajo acelerados. Vera BlueField 4 STX impulsa aún más la memoria de contexto y el almacenamiento de IA, proporcionando una solución completa de computación, redes y almacenamiento para la era de los agentes.
Cosmos 3: La IA que entiende la realidad
Nvidia presentó Cosmos 3, un modelo mundial omnimodal diseñado para redefinir la Physical AI. Este sistema fundamental otorga a los robots y vehículos autónomos una profunda comprensión del mundo físico al procesar un rico tapiz de datos: video, sonido, texto y entradas de acciones críticas. Establece una percepción robusta y holística de la realidad para agentes inteligentes.
Cosmos 3 opera a una escala sin precedentes, entrenado con la asombrosa cantidad de 20 billones de tokens de datos multimodales. Su corpus de entrenamiento abarca casi 4 mil millones de imágenes, 400 millones de videos reales y sintéticos, junto con vastos conjuntos de datos de sonido, texto y acción. Esto permite a Cosmos 3 trascender la mera observación; produce activamente "action data", lo que permite a los sistemas predecir resultados y tomar decisiones sofisticadas. Este enfoque innovador unifica sin problemas los modelos de mundo tradicionales y los modelos de acción en un marco único y potente.
Nvidia refuerza su compromiso con la innovación abierta al convertir a Cosmos 3 en un modelo abierto. Los desarrolladores pueden acceder fácilmente a sus pesos en Hugging Face y al código fuente completo en GitHub. Esto democratiza el acceso a un potente punto de partida para los avances en robótica, simulaciones complejas y sistemas autónomos, acelerando directamente la revolución de la IA física en general. Para obtener información más detallada sobre el ecosistema de IA agéntica de Nvidia, incluida la Vera CPU, consulte NVIDIA Unveils Vera, the CPU for Agents.
Tu Próximo PC es un Agente de IA
Nvidia y Microsoft se asocian para "reinventar el PC por primera vez en 40 años", presentando el innovador superchip RTX Spark. Esta colaboración marca un cambio profundo, transformando el ordenador personal de un dispositivo que simplemente ejecuta aplicaciones a uno que aloja y ejecuta agentes de IA nativos sin problemas. Esta iniciativa redefine fundamentalmente la experiencia del usuario y el propósito mismo de la informática personal.
Las especificaciones de Spark son nada menos que monstruosas, diseñadas para capacidades de IA local sin igual. Un solo chip fusiona una potente Blackwell RTX GPU, que cuenta con la inmensa cantidad de 6.144 CUDA cores, con una Grace CPU personalizada de 20 núcleos. Esta potencia integrada ofrece un asombroso un petaFLOP de rendimiento de IA, todo ello respaldado por una masiva 128GB de unified memory, eliminando los cuellos de botella de datos tradicionales y permitiendo tareas complejas de IA.
Los futuros PC ejecutarán IA personales de forma continua y segura, operando completamente dentro de un entorno de sandbox local directamente en el dispositivo. Esto garantiza tanto una privacidad robusta como una funcionalidad siempre activa para los usuarios individuales, capacitándolos con asistencia inteligente sin depender de la nube. RTX Spark proporciona la base de hardware esencial para una nueva plataforma Windows, diseñada específicamente para permitir este profundo cambio de paradigma hacia una informática personal agéntica y omnipresente.
Preguntas Frecuentes
¿Qué es Nvidia Nemotron 3 Ultra?
Nemotron 3 Ultra es el nuevo modelo de lenguaje grande de código completamente abierto de Nvidia con 550 mil millones de parámetros. Está diseñado para ser 5 veces más rápido y un 30% más barato de ejecutar que los modelos abiertos comparables.
¿Por qué Nvidia creó la Vera CPU?
Nvidia creó la Vera CPU específicamente para la 'era de los agentes'. Está diseñada para eliminar el cuello de botella de rendimiento de las CPU tradicionales en los flujos de trabajo de IA, actuando como un director para tareas intensivas en GPU.
¿Para qué se utiliza Nvidia Cosmos 3?
Cosmos 3 es un modelo fundacional abierto para la 'IA física'. Ayuda a robots, coches autónomos y otros sistemas físicos a comprender, predecir y actuar dentro del mundo real utilizando datos multimodales.
¿Qué es RTX Spark?
RTX Spark es un nuevo 'superchip' desarrollado por Nvidia y Microsoft para reinventar el PC para la era de la IA. Combina una potente Blackwell RTX GPU y una Grace CPU para ejecutar agentes de IA sofisticados localmente en tu ordenador.