En bref / Points clés
Nemotron 3 : Le pari open-source de Nvidia
Nvidia a dévoilé Nemotron 3 Ultra, un modèle AI open-source monumental. Ce monstre affiche 550 milliards de parameters au total, avec jusqu'à 55 milliards actifs par token, construit sur une architecture hybride révolutionnaire Mamba (SSM) et Transformer Mixture-of-Experts (MoE). Cette combinaison unique offre une vitesse de traitement exceptionnelle, établissant une nouvelle référence en matière d'efficacité des modèles.
Nvidia démontre un engagement profond envers le développement de l'AI ouverte avec Nemotron 3 Ultra. Contrairement à d'autres modèles, Nvidia fournit un package open-source véritablement complet, en publiant : - Les poids du modèle - Les scripts d'entraînement - L'ensemble complet de données Cette transparence sans précédent permet aux développeurs du monde entier d'inspecter, de développer et de personnaliser librement le modèle, favorisant l'innovation au sein de la communauté AI.
Jensen Huang a souligné la performance transformative de Nemotron 3 Ultra. Il a déclaré qu'il fonctionne 5 fois plus vite et est 30 % moins cher pour l'inference que les meilleurs modèles ouverts du monde, même les plus rentables. Ce saut architectural permet aux agents AI d'exécuter des tâches plus complexes et plus longues au même coût, leur permettant ainsi de « penser plus longtemps » et plus profondément dans les limites des budgets existants.
Vera : Le CPU conçu pour votre assistant AI
Les CPU traditionnels représentent un goulot d'étranglement significatif pour l'AI, en particulier au sein de la 'boucle agentique' où un CPU doit gérer et alimenter efficacement les puissants GPU en données. Cette architecture traditionnelle, conçue pour une autre époque, entrave directement l'utilisation des GPU, réduisant le débit de token, augmentant la latence et dégradant l'expérience utilisateur dans les applications AI sophistiquées.
Nvidia a dévoilé Vera, un CPU spécialement conçu pour l'ère des agents. Au cœur de celui-ci se trouve le Olympus Core personnalisé, conçu pour les charges de travail des centres de données modernes comme les runtimes Python à forte ramification et l'exécution de code sandbox. Un tissu de cohérence évolutif unifie les 88 cœurs Olympus sur un maillage monolithique, permettant une communication cœur à cœur 50 % plus rapide que les conceptions traditionnelles de chiplets. Vera est également le premier CPU à intégrer la mémoire LPDDR5X, offrant une latence mémoire de pointe 40 % inférieure à celle des x86, cruciale pour la récupération et l'analyse rapides des données.
Vera offre 1,8 fois la agentic sandbox performance des CPU x86. Cette augmentation substantielle se traduit directement par un débit de token plus élevé et une expérience utilisateur supérieure pour les applications AI complexes. Étroitement couplé aux Rubin GPUs via des connexions NVLink chip-to-chip à cohérence mémoire, Vera assure des flux de travail accélérés. Vera BlueField 4 STX alimente en outre la mémoire contextuelle et le stockage AI, offrant une solution complète de calcul, de réseau et de stockage pour l'ère des agents.
Cosmos 3 : L'AI qui comprend la réalité
Nvidia a dévoilé Cosmos 3, un modèle mondial omnimodal conçu pour redéfinir l'Physical AI. Ce système fondamental confère aux robots et aux véhicules autonomes une compréhension profonde du monde physique en traitant une riche mosaïque de données : vidéo, son, texte et entrées d'actions critiques. Il établit une perception robuste et holistique de la réalité pour les agents intelligents.
Cosmos 3 fonctionne à une échelle sans précédent, entraîné sur un nombre stupéfiant de 20 billions de jetons de données multimodales. Son corpus d'entraînement comprend près de 4 milliards d'images, 400 millions de vidéos réelles et synthétiques, ainsi que de vastes ensembles de données sonores, textuelles et d'action. Cela permet à Cosmos 3 de transcender la simple observation ; il produit activement des « action data », permettant aux systèmes de prédire les résultats et de prendre des décisions sophistiquées. Cette approche innovante unifie de manière transparente les modèles de monde traditionnels et les modèles d'action en un cadre unique et puissant.
Nvidia renforce son engagement envers l'innovation ouverte en faisant de Cosmos 3 un modèle ouvert. Les développeurs peuvent facilement accéder à ses poids sur Hugging Face et au code source complet sur GitHub. Cela démocratise l'accès à un puissant point de départ pour les avancées en robotique, les simulations complexes et les systèmes autonomes, accélérant directement la révolution plus large de l'IA physique. Pour des informations plus approfondies sur l'écosystème d'IA agentique de Nvidia, y compris le Vera CPU, consultez NVIDIA Unveils Vera, the CPU for Agents.
Votre prochain PC est un agent d'IA
Nvidia et Microsoft s'associent pour « réinventer le PC pour la première fois en 40 ans », en introduisant le superchip révolutionnaire RTX Spark. Cette collaboration marque un changement profond, transformant l'ordinateur personnel d'un appareil qui exécute simplement des applications en un appareil qui héberge et exécute des agents d'IA natifs de manière transparente. Cette initiative redéfinit fondamentalement l'expérience utilisateur et la raison d'être même de l'informatique personnelle.
Les spécifications de Spark sont tout simplement monstrueuses, conçues pour des capacités d'IA locales inégalées. Une seule puce fusionne un puissant Blackwell RTX GPU, doté d'un immense 6 144 CUDA cores, avec un Grace CPU personnalisé à 20 cœurs. Cette centrale intégrée offre une performance d'IA stupéfiante d'un petaFLOP, le tout soutenu par une mémoire unifiée massive de 128 Go, éliminant les goulots d'étranglement de données traditionnels et permettant des tâches d'IA complexes.
Les futurs PC exécuteront des IA personnelles en continu et en toute sécurité, fonctionnant entièrement dans un environnement de sandbox local directement sur l'appareil. Cela garantit à la fois une confidentialité robuste et une fonctionnalité toujours active pour les utilisateurs individuels, leur offrant une assistance intelligente sans dépendre du cloud. RTX Spark fournit la base matérielle essentielle pour une nouvelle plateforme Windows, conçue spécifiquement pour permettre ce profond changement de paradigme vers une informatique personnelle omniprésente et agentique.
Questions Fréquemment Posées
Qu'est-ce que Nvidia Nemotron 3 Ultra ?
Nemotron 3 Ultra est le nouveau grand modèle linguistique entièrement open-source de Nvidia, doté de 550 milliards de paramètres. Il est conçu pour être 5 fois plus rapide et 30 % moins cher à exécuter que les modèles ouverts comparables.
Pourquoi Nvidia a-t-il créé le Vera CPU ?
Nvidia a créé le Vera CPU spécifiquement pour l'« ère des agents ». Il est conçu pour éliminer le goulot d'étranglement des performances des CPU traditionnels dans les flux de travail d'IA, agissant comme un chef d'orchestre pour les tâches gourmandes en GPU.
À quoi sert Nvidia Cosmos 3 ?
Cosmos 3 est un modèle de fondation ouvert pour l'« IA physique ». Il aide les robots, les voitures autonomes et d'autres systèmes physiques à comprendre, prédire et agir dans le monde réel en utilisant des données multimodales.
Qu'est-ce que RTX Spark ?
RTX Spark est un nouveau « superchip » développé par Nvidia et Microsoft pour réinventer le PC pour l'ère de l'IA. Il combine un puissant Blackwell RTX GPU et un Grace CPU pour exécuter des agents d'IA sophistiqués localement sur votre ordinateur.