Skip to content

Nvidia hat gerade die Zukunft der KI neu definiert

Nvidia hat auf der GTC Taipei vier Paukenschläge gelandet und ein radikal neues Open-Source-Modell sowie eine komplett für KI-Agenten entwickelte CPU vorgestellt. Diese Updates signalisieren eine vollständige Überarbeitung des Computings, von Rechenzentren bis zum PC auf Ihrem Schreibtisch.

Stork.AI
Hero image for: Nvidia hat gerade die Zukunft der KI neu definiert

Zusammenfassung / Kernpunkte

Nvidia hat auf der GTC Taipei vier Paukenschläge gelandet und ein radikal neues Open-Source-Modell sowie eine komplett für KI-Agenten entwickelte CPU vorgestellt. Diese Updates signalisieren eine vollständige Überarbeitung des Computings, von Rechenzentren bis zum PC auf Ihrem Schreibtisch.

Nemotron 3: Nvidias Open-Source-Gambit

Nvidia stellte Nemotron 3 Ultra vor, ein monumentales Open-Source-KI-Modell. Dieses Monster verfügt über insgesamt 550 Milliarden Parameter, davon bis zu 55 Milliarden aktiv pro Token, und basiert auf einer bahnbrechenden hybriden Mamba (SSM)- und Transformer Mixture-of-Experts (MoE)-Architektur. Diese einzigartige Kombination liefert eine außergewöhnliche Verarbeitungsgeschwindigkeit und setzt einen neuen Maßstab für die Modelleffizienz.

Nvidia demonstriert mit Nemotron 3 Ultra ein tiefes Engagement für die offene KI-Entwicklung. Im Gegensatz zu anderen Modellen bietet Nvidia ein wirklich umfassendes Open-Source-Paket, das Folgendes veröffentlicht: - Modellgewichte - Trainingsskripte - Vollständiger Datensatz Diese beispiellose Transparenz ermöglicht es Entwicklern weltweit, das Modell frei zu prüfen, darauf aufzubauen und es anzupassen, wodurch Innovationen in der gesamten KI-Community gefördert werden.

Jensen Huang betonte die transformative Leistung von Nemotron 3 Ultra. Er erklärte, dass es für die Inferenz 5x schneller und 30 % günstiger läuft als die besten offenen Modelle der Welt, selbst die kostengünstigsten. Dieser architektonische Sprung ermöglicht es KI-Agenten, komplexere, länger dauernde Aufgaben zu den gleichen Kosten auszuführen, wodurch sie innerhalb bestehender Budgets effektiver „länger denken“ und tiefer analysieren können.

Vera: Die CPU, die für Ihren KI-Assistenten entwickelt wurde

Traditionelle CPUs stellen einen erheblichen Engpass für KI dar, insbesondere innerhalb des 'agentic loop', wo eine CPU Daten effizient verwalten und an leistungsstarke GPUs liefern muss. Diese traditionelle Architektur, die für eine andere Ära konzipiert wurde, behindert direkt die GPU-Auslastung, drosselt den Token-Durchsatz, erhöht die Latenz und verschlechtert die Benutzererfahrung in anspruchsvollen KI-Anwendungen.

Nvidia stellte Vera vor, eine CPU, die speziell für das Zeitalter der Agenten entwickelt wurde. Ihr Herzstück ist der kundenspezifische Olympus Core, der für moderne Rechenzentrumslasten wie verzweigungsintensive Python-Laufzeiten und Sandbox-Codeausführung konzipiert ist. Ein skalierbares Kohärenz-Fabric vereint alle 88 Olympus-Kerne auf einem monolithischen Mesh und ermöglicht eine 50 % schnellere Kern-zu-Kern-Kommunikation als herkömmliche Chiplet-Designs. Vera ist auch die erste CPU, die LPDDR5X-Speicher integriert, was eine um 40 % geringere Spitzen-Speicherlatenz im Vergleich zu x86 liefert, entscheidend für den zeitnahen Datenabruf und die Analyse.

Vera liefert die 1,8-fache agentic sandbox performance von x86-CPUs. Dieser erhebliche Schub führt direkt zu einem höheren Token-Durchsatz und einer überlegenen Benutzererfahrung für komplexe KI-Anwendungen. Eng gekoppelt mit Rubin GPUs über speicherkohärente NVLink Chip-zu-Chip-Verbindungen, gewährleistet Vera beschleunigte Workflows. Vera BlueField 4 STX versorgt zusätzlich den Kontextspeicher und den KI-Speicher und bietet eine komplette Compute-, Netzwerk- und Speicherlösung für das Zeitalter der Agenten.

Cosmos 3: Die KI, die die Realität versteht

Nvidia stellte Cosmos 3 vor, ein omnimodales Weltmodell, das entwickelt wurde, um Physical AI neu zu definieren. Dieses grundlegende System verleiht Robotern und autonomen Fahrzeugen ein tiefgreifendes Verständnis der physischen Welt, indem es eine reiche Vielfalt von Daten verarbeitet: Video, Ton, Text und kritische Aktionseingaben. Es etabliert eine robuste, ganzheitliche Wahrnehmung der Realität für intelligente Agenten.

Cosmos 3 arbeitet in einem beispiellosen Maßstab und wurde mit erstaunlichen 20 Billionen Tokens multimodaler Daten trainiert. Sein Trainingskorpus umfasst fast 4 Milliarden Bilder, 400 Millionen reale und synthetische Videos sowie umfangreiche Ton-, Text- und Aktionsdatensätze. Dies ermöglicht Cosmos 3, über die bloße Beobachtung hinauszugehen; es gibt aktiv "action data" aus, wodurch Systeme Ergebnisse vorhersagen und ausgeklügelte Entscheidungen treffen können. Dieser innovative Ansatz vereint traditionelle Weltmodelle und Aktionsmodelle nahtlos in einem einzigen, leistungsstarken Framework.

Nvidia stärkt sein Engagement für offene Innovation, indem es Cosmos 3 zu einem offenen Modell macht. Entwickler können die Gewichte auf Hugging Face und den vollständigen Quellcode auf GitHub problemlos abrufen. Dies demokratisiert den Zugang zu einem leistungsstarken Ausgangspunkt für Fortschritte in der Robotik, komplexen Simulationen und autonomen Systemen und beschleunigt direkt die breitere Revolution der physischen KI. Für tiefere Einblicke in Nvidias agentisches KI-Ökosystem, einschließlich der Vera CPU, siehe NVIDIA Unveils Vera, the CPU for Agents.

Ihr nächster PC ist ein KI-Agent

Nvidia und Microsoft arbeiten zusammen, um „den PC zum ersten Mal seit 40 Jahren neu zu erfinden“, indem sie den bahnbrechenden RTX Spark Superchip vorstellen. Diese Zusammenarbeit markiert einen tiefgreifenden Wandel, der den Personal Computer von einem Gerät, das lediglich Anwendungen ausführt, in eines verwandelt, das native KI-Agenten nahtlos hostet und ausführt. Diese Initiative definiert das Benutzererlebnis und den eigentlichen Zweck des Personal Computing grundlegend neu.

Die Spezifikationen von Spark sind geradezu monströs und für unvergleichliche lokale KI-Fähigkeiten konzipiert. Ein einziger Chip vereint eine leistungsstarke Blackwell RTX GPU mit immensen 6.144 CUDA cores und eine kundenspezifische 20-Kern Grace CPU. Dieses integrierte Kraftpaket liefert eine erstaunliche KI-Leistung von einem petaFLOP, alles unterstützt durch massive 128 GB unified memory, wodurch traditionelle Datenengpässe beseitigt und komplexe KI-Aufgaben ermöglicht werden.

Zukünftige PCs werden persönliche KIs kontinuierlich und sicher ausführen, vollständig innerhalb einer lokalen Sandbox-Umgebung direkt auf dem Gerät. Dies gewährleistet sowohl robuste Privatsphäre als auch Always-on-Funktionalität für einzelne Benutzer und befähigt sie mit intelligenter Unterstützung, ohne auf die Cloud angewiesen zu sein. RTX Spark bietet die wesentliche Hardware-Grundlage für eine neue Windows-Plattform, die speziell entwickelt wurde, um diesen tiefgreifenden Paradigmenwechsel hin zu einem allgegenwärtigen, agentischen Personal Computing zu ermöglichen.

Häufig gestellte Fragen

Was ist Nvidia Nemotron 3 Ultra?

Nemotron 3 Ultra ist Nvidias neues, vollständig Open-Source großes Sprachmodell mit 550 Milliarden Parametern. Es ist darauf ausgelegt, 5x schneller und 30% kostengünstiger zu laufen als vergleichbare offene Modelle.

Warum hat Nvidia die Vera CPU entwickelt?

Nvidia hat die Vera CPU speziell für das 'Zeitalter der Agenten' entwickelt. Sie wurde konzipiert, um den Leistungsengpass traditioneller CPUs in KI-Workflows zu beseitigen und als Dirigent für GPU-intensive Aufgaben zu fungieren.

Wofür wird Nvidia Cosmos 3 verwendet?

Cosmos 3 ist ein offenes Basismodell für 'physical AI'. Es hilft Robotern, selbstfahrenden Autos und anderen physischen Systemen, die reale Welt mithilfe multimodaler Daten zu verstehen, vorherzusagen und in ihr zu agieren.

Was ist RTX Spark?

RTX Spark ist ein neuer 'Superchip', der von Nvidia und Microsoft entwickelt wurde, um den PC für das KI-Zeitalter neu zu erfinden. Er kombiniert eine leistungsstarke Blackwell RTX GPU und eine Grace CPU, um anspruchsvolle KI-Agenten lokal auf Ihrem Computer auszuführen.

One weekly email of tools worth shipping. No drip funnel.

one email per week · unsubscribe in two clicks · no third-party tracking

🚀Mehr entdecken

Bleiben Sie der KI voraus

Entdecken Sie die besten KI-Tools, Agenten und MCP-Server, kuratiert von Stork.AI.

P.S. Etwas Brauchbares gebaut? Bei Stork listen

Zurück zu allen Beiträgen