요약 / 핵심 포인트
Nemotron 3: Nvidia의 오픈소스 전략
Nvidia는 기념비적인 오픈소스 AI 모델인 Nemotron 3 Ultra를 공개했습니다. 이 거대한 모델은 5,500억 개의 총 매개변수를 자랑하며, 토큰당 최대 550억 개가 활성화되고, 획기적인 하이브리드 Mamba (SSM) 및 Transformer Mixture-of-Experts (MoE) 아키텍처를 기반으로 구축되었습니다. 이 독특한 조합은 탁월한 처리 속도를 제공하며 모델 효율성의 새로운 기준을 제시합니다.
Nvidia는 Nemotron 3 Ultra를 통해 개방형 AI 개발에 대한 깊은 의지를 보여줍니다. 다른 모델과 달리 Nvidia는 다음과 같은 진정으로 포괄적인 오픈소스 패키지를 제공합니다: - 모델 가중치 - 훈련 스크립트 - 전체 데이터셋 이러한 전례 없는 투명성은 전 세계 개발자들이 모델을 자유롭게 검사하고, 기반으로 구축하며, 맞춤화할 수 있도록 하여 AI 커뮤니티 전반의 혁신을 촉진합니다.
Jensen Huang은 Nemotron 3 Ultra의 혁신적인 성능을 강조했습니다. 그는 이 모델이 세계 최고의 오픈 모델, 심지어 가장 비용 효율적인 모델보다 추론에서 5배 더 빠르고 30% 더 저렴하게 실행된다고 밝혔습니다. 이러한 아키텍처적 도약은 AI 에이전트가 동일한 비용으로 더 복잡하고 오래 실행되는 작업을 수행할 수 있도록 하여, 기존 예산 내에서 더 "오래 생각하고" 더 깊이 사고할 수 있도록 효과적으로 지원합니다.
Vera: AI 비서를 위해 구축된 CPU
기존 CPU는 AI에 상당한 병목 현상을 일으키며, 특히 CPU가 강력한 GPU에 데이터를 효율적으로 관리하고 공급해야 하는 '에이전트 루프' 내에서 더욱 그렇습니다. 다른 시대를 위해 설계된 이 전통적인 아키텍처는 GPU 활용을 직접적으로 방해하고, 토큰 처리량을 제한하며, 지연 시간을 증가시키고, 정교한 AI 애플리케이션에서 사용자 경험을 저하시킵니다.
Nvidia는 에이전트 시대를 위해 특별히 제작된 CPU인 Vera를 공개했습니다. 그 핵심에는 분기 집약적인 Python 런타임 및 샌드박스 코드 실행과 같은 최신 데이터 센터 워크로드를 위해 설계된 맞춤형 Olympus Core가 있습니다. 확장 가능한 일관성 패브릭은 단일 메시에서 88개의 Olympus 코어 전체를 통합하여 기존 칩렛 설계보다 50% 더 빠른 코어 간 통신을 가능하게 합니다. Vera는 또한 LPDDR5X 메모리를 통합한 최초의 CPU로, x86에 비해 피크 메모리 지연 시간을 40% 낮춰 적시 데이터 검색 및 분석에 중요합니다.
Vera는 x86 CPU보다 1.8배 더 높은 에이전트 샌드박스 성능을 제공합니다. 이러한 상당한 향상은 복잡한 AI 애플리케이션에서 더 높은 토큰 처리량과 우수한 사용자 경험으로 직접 이어집니다. 메모리 일관성 NVLink 칩 간 연결을 통해 Rubin GPU와 긴밀하게 연결된 Vera는 가속화된 워크플로우를 보장합니다. Vera BlueField 4 STX는 컨텍스트 메모리 및 AI 스토리지를 더욱 강화하여 에이전트 시대를 위한 완벽한 컴퓨팅, 네트워킹 및 스토리지 솔루션을 제공합니다.
Cosmos 3: 현실을 이해하는 AI
Nvidia는 Physical AI를 재정의하도록 설계된 옴니모달(omnimodal) 세계 모델인 Cosmos 3를 공개했습니다. 이 기반 시스템은 비디오, 사운드, 텍스트 및 중요한 동작 입력과 같은 풍부한 데이터 태피스트리를 처리하여 로봇과 자율주행 차량에 물리적 세계에 대한 깊은 이해를 부여합니다. 이는 지능형 에이전트를 위한 견고하고 전체적인 현실 인식을 확립합니다.
Cosmos 3는 전례 없는 규모로 작동하며, 무려 20조 개의 멀티모달 데이터 토큰으로 훈련되었습니다. 이 훈련 코퍼스는 거의 40억 개의 이미지, 4억 개의 실제 및 합성 비디오, 그리고 방대한 사운드, 텍스트, 액션 데이터셋을 포함합니다. 이는 Cosmos 3가 단순한 관찰을 넘어설 수 있도록 지원합니다. Cosmos 3는 능동적으로 "액션 데이터"를 출력하여 시스템이 결과를 예측하고 정교한 결정을 내릴 수 있도록 합니다. 이 혁신적인 접근 방식은 전통적인 세계 모델과 액션 모델을 단일의 강력한 프레임워크로 완벽하게 통합합니다.
Nvidia는 Cosmos 3를 오픈 모델로 공개함으로써 개방형 혁신에 대한 약속을 강화합니다. 개발자들은 Hugging Face에서 가중치에 쉽게 접근하고 GitHub에서 전체 소스 코드를 확인할 수 있습니다. 이는 로봇 공학, 복잡한 시뮬레이션 및 자율 시스템의 발전을 위한 강력한 출발점에 대한 접근을 민주화하여, 더 넓은 물리적 AI 혁명을 직접적으로 가속화합니다. Vera CPU를 포함한 Nvidia의 에이전트 AI 생태계에 대한 더 깊은 통찰력을 얻으려면 NVIDIA Unveils Vera, the CPU for Agents를 참조하십시오.
당신의 다음 PC는 AI 에이전트입니다
Nvidia와 Microsoft는 획기적인 RTX Spark 슈퍼칩을 도입하며 "40년 만에 처음으로 PC를 재창조"하기 위해 협력하고 있습니다. 이 협력은 개인용 컴퓨터를 단순히 애플리케이션을 실행하는 장치에서 네이티브 AI 에이전트를 원활하게 호스팅하고 실행하는 장치로 변화시키는 심오한 변화를 의미합니다. 이 이니셔티브는 사용자 경험과 개인용 컴퓨팅의 목적 자체를 근본적으로 재정의합니다.
Spark의 사양은 타의 추종을 불허하는 로컬 AI 기능을 위해 설계된 엄청난 수준입니다. 단일 칩은 강력한 Blackwell RTX GPU(무려 6,144개의 CUDA 코어 자랑)와 맞춤형 20코어 Grace CPU를 융합합니다. 이 통합된 강력한 장치는 무려 1 petaFLOP의 AI 성능을 제공하며, 방대한 128GB의 통합 메모리로 지원되어 전통적인 데이터 병목 현상을 제거하고 복잡한 AI 작업을 가능하게 합니다.
미래의 PC는 개인 AI를 장치 내 로컬 샌드박스 환경에서 직접, 지속적으로, 그리고 안전하게 실행할 것입니다. 이는 개별 사용자에게 강력한 개인 정보 보호와 항상 켜져 있는 기능을 모두 보장하여 클라우드에 의존하지 않고도 지능적인 지원을 제공합니다. RTX Spark는 보편적인 에이전트 기반 개인 컴퓨팅으로의 심오한 패러다임 전환을 가능하게 하기 위해 특별히 구축된 새로운 Windows 플랫폼을 위한 필수 하드웨어 기반을 제공합니다.
자주 묻는 질문
Nvidia Nemotron 3 Ultra는 무엇입니까?
Nemotron 3 Ultra는 5,500억 개의 매개변수를 가진 Nvidia의 새로운 완전 오픈 소스 대규모 언어 모델입니다. 유사한 오픈 모델보다 5배 빠르고 실행 비용이 30% 저렴하도록 설계되었습니다.
Nvidia는 왜 Vera CPU를 만들었습니까?
Nvidia는 '에이전트 시대'를 위해 특별히 Vera CPU를 만들었습니다. 이는 AI 워크플로우에서 전통적인 CPU의 성능 병목 현상을 제거하고, GPU 집약적인 작업의 지휘자 역할을 하도록 설계되었습니다.
Nvidia Cosmos 3는 무엇에 사용됩니까?
Cosmos 3는 '물리적 AI'를 위한 오픈 파운데이션 모델입니다. 이는 로봇, 자율 주행 자동차 및 기타 물리적 시스템이 멀티모달 데이터를 사용하여 실제 세계를 이해하고, 예측하고, 행동하도록 돕습니다.
RTX Spark는 무엇입니까?
RTX Spark는 AI 시대를 위해 PC를 재창조하기 위해 Nvidia와 Microsoft가 개발한 새로운 '슈퍼칩'입니다. 강력한 Blackwell RTX GPU와 Grace CPU를 결합하여 정교한 AI 에이전트를 컴퓨터에서 로컬로 실행합니다.