要約 / ポイント
Nemotron 3: Nvidiaのオープンソース戦略
Nvidiaは、記念碑的なオープンソースAIモデルであるNemotron 3 Ultraを発表しました。この巨大モデルは、画期的なハイブリッドMamba (SSM) とTransformerのMixture-of-Experts (MoE)アーキテクチャに基づいて構築されており、合計5500億のパラメータを持ち、トークンあたり最大550億のパラメータがアクティブになります。この独自の組み合わせは、卓越した処理速度を実現し、モデル効率の新たなベンチマークを確立します。
Nvidiaは、Nemotron 3 Ultraを通じてオープンAI開発への深いコミットメントを示しています。他のモデルとは異なり、Nvidiaは真に包括的なオープンソースパッケージを提供し、以下を公開しています。 - モデルの重み - トレーニングスクリプト - 完全なデータセット この前例のない透明性により、世界中の開発者はモデルを自由に検査し、その上に構築し、カスタマイズすることができ、AIコミュニティ全体でのイノベーションを促進します。
Jensen Huangは、Nemotron 3 Ultraの革新的なパフォーマンスを強調しました。彼は、推論において世界の最高のオープンモデル、さらには最も費用対効果の高いモデルよりも5倍高速で30%安価に動作すると述べました。このアーキテクチャの飛躍により、AIエージェントは同じコストでより複雑で長時間のタスクを実行できるようになり、既存の予算内でより「長く深く考える」ことが事実上可能になります。
Vera: あなたのAIアシスタントのために構築されたCPU
従来のCPUはAIにとって大きなボトルネックとなります。特に、CPUが強力なGPUにデータを効率的に管理し供給する必要がある「エージェントループ」において顕著です。異なる時代のために設計されたこの従来のアーキテクチャは、GPUの利用率を直接妨げ、トークンスループットを抑制し、レイテンシを増加させ、高度なAIアプリケーションにおけるユーザーエクスペリエンスを低下させます。
Nvidiaは、エージェント時代のために特別に構築されたCPU、Veraを発表しました。その核となるのは、分岐の多いPythonランタイムやサンドボックスコード実行のような現代のデータセンターワークロード向けに設計されたカスタムOlympus Coreです。スケーラブルなコヒーレンシファブリックは、モノリシックメッシュ上で88個すべてのOlympusコアを統合し、従来のチップレット設計よりも50%高速なコア間通信を可能にします。Veraはまた、LPDDR5Xメモリを統合した初のCPUであり、x86と比較してピークメモリレイテンシを40%低減し、タイムリーなデータ取得と分析に不可欠です。
Veraは、x86 CPUのエージェントサンドボックス性能の1.8倍を実現します。この大幅な向上は、複雑なAIアプリケーションにおけるトークンスループットの増加と優れたユーザーエクスペリエンスに直接つながります。メモリコヒーレントなNVLinkチップ間接続を介してRubin GPUと密接に結合することで、Veraはワークフローの高速化を保証します。Vera BlueField 4 STXは、コンテキストメモリとAIストレージをさらに強化し、エージェント時代のための完全なコンピューティング、ネットワーキング、ストレージソリューションを提供します。
Cosmos 3: 現実を理解するAI
Nvidiaは、Physical AIを再定義するために設計されたオムニモーダルな世界モデル、Cosmos 3を発表しました。この基盤システムは、ビデオ、音声、テキスト、重要なアクション入力といった豊富なデータを処理することで、ロボットや自動運転車に物理世界の深い理解を与えます。これにより、インテリジェントエージェントのための堅牢で全体的な現実認識を確立します。
Cosmos 3は、前例のない規模で動作し、驚異的な20兆トークンのマルチモーダルデータでトレーニングされています。そのトレーニングコーパスには、約40億の画像、4億の現実および合成ビデオ、そして膨大なサウンド、テキスト、アクションデータセットが含まれています。これにより、Cosmos 3は単なる観察を超越し、積極的に「アクションデータ」を出力し、システムが結果を予測し、高度な意思決定を行うことを可能にします。この革新的なアプローチは、従来のワールドモデルとアクションモデルを単一の強力なフレームワークにシームレスに統合します。
Nvidiaは、Cosmos 3をオープンモデルにすることで、オープンイノベーションへのコミットメントを強化しています。開発者は、Hugging Faceでそのウェイトに、GitHubで完全なソースコードに簡単にアクセスできます。これにより、ロボティクス、複雑なシミュレーション、自律システムにおける進歩のための強力な出発点へのアクセスが民主化され、より広範な物理AI革命を直接加速します。NvidiaのエージェントAIエコシステム(Vera CPUを含む)に関するより深い洞察については、NVIDIA Unveils Vera, the CPU for Agentsをご参照ください。
あなたの次のPCはAIエージェントです
NvidiaとMicrosoftは、「40年ぶりにPCを再発明する」ために提携し、画期的なRTX Sparkスーパーチップを発表します。このコラボレーションは、パーソナルコンピューターを単にアプリケーションを実行するデバイスから、ネイティブAIエージェントをシームレスにホストおよび実行するデバイスへと変革する、大きな変化を示します。この取り組みは、ユーザーエクスペリエンスとパーソナルコンピューティングの目的そのものを根本的に再定義します。
Sparkの仕様は驚異的で、比類のないローカルAI機能のために設計されています。単一のチップには、強力なBlackwell RTX GPU(6,144 CUDAコアを誇る)とカスタムの20コアGrace CPUが融合されています。この統合された強力なシステムは、驚異的な1 petaFLOPのAIパフォーマンスを提供し、すべてが massive 128GBのunified memoryによって支えられており、従来のデータボトルネックを排除し、複雑なAIタスクを可能にします。
将来のPCは、デバイス上で直接、ローカルサンドボックス環境内で完全に動作し、パーソナルAIを継続的かつ安全に実行します。これにより、個々のユーザーは堅牢なプライバシーと常時稼働の機能の両方を確保でき、クラウドに依存することなくインテリジェントなアシスタンスを利用できるようになります。RTX Sparkは、この普及したエージェント型パーソナルコンピューティングへの大きなパラダイムシフトを可能にするために特別に構築された、新しいWindowsプラットフォームの不可欠なハードウェア基盤を提供します。
よくある質問
Nvidia Nemotron 3 Ultraとは何ですか?
Nemotron 3 Ultraは、Nvidiaの新しい完全オープンソースの大規模言語モデルで、5500億のパラメーターを持っています。同等のオープンモデルと比較して、5倍高速で、実行コストが30%安くなるように設計されています。
NvidiaはなぜVera CPUを開発したのですか?
Nvidiaは、「エージェントの時代」のために特別にVera CPUを開発しました。これは、AIワークフローにおける従来のCPUのパフォーマンスボトルネックを解消し、GPUを多用するタスクの指揮者として機能するように設計されています。
Nvidia Cosmos 3は何に使われますか?
Cosmos 3は、「物理AI」のためのオープンな基盤モデルです。ロボット、自動運転車、その他の物理システムがマルチモーダルデータを使用して現実世界を理解し、予測し、行動するのを助けます。
RTX Sparkとは何ですか?
RTX Sparkは、AI時代のためにPCを再発明するためにNvidiaとMicrosoftが開発した新しい「スーパーチップ」です。強力なBlackwell RTX GPUとGrace CPUを組み合わせて、洗練されたAIエージェントをコンピューター上でローカルに実行します。