Кратко / Главное
Nemotron 3: Гамбит Nvidia с открытым исходным кодом
Nvidia представила Nemotron 3 Ultra, монументальную модель ИИ с открытым исходным кодом. Этот монстр может похвастаться 550 миллиардами общих параметров, до 55 миллиардов активных на токен, построенных на новаторской гибридной архитектуре Mamba (SSM) и Transformer Mixture-of-Experts (MoE). Эта уникальная комбинация обеспечивает исключительную скорость обработки, устанавливая новый эталон эффективности модели.
Nvidia демонстрирует глубокую приверженность развитию открытого ИИ с помощью Nemotron 3 Ultra. В отличие от других моделей, Nvidia предоставляет по-настоящему комплексный пакет с открытым исходным кодом, выпуская: - Веса модели - Скрипты для обучения - Полный набор данных Эта беспрецедентная прозрачность позволяет разработчикам по всему миру свободно изучать, развивать и настраивать модель, способствуя инновациям в сообществе ИИ.
Дженсен Хуанг подчеркнул трансформационную производительность Nemotron 3 Ultra. Он заявил, что модель работает в 5 раз быстрее и на 30% дешевле для инференса, чем лучшие открытые модели мира, даже самые экономичные. Этот архитектурный прорыв позволяет ИИ-агентам выполнять более сложные и длительные задачи при той же стоимости, фактически позволяя им «думать дольше» и глубже в рамках существующих бюджетов.
Vera: Центральный процессор, созданный для вашего ИИ-помощника
Традиционные центральные процессоры представляют собой значительное узкое место для ИИ, особенно в рамках «агентного цикла», где центральный процессор должен эффективно управлять данными и передавать их мощным GPU. Эта традиционная архитектура, разработанная для другой эпохи, напрямую препятствует использованию GPU, ограничивая пропускную способность токенов, увеличивая задержку и ухудшая пользовательский опыт в сложных ИИ-приложениях.
Nvidia представила Vera, центральный процессор, специально разработанный для эпохи агентов. В его основе лежит настраиваемое ядро Olympus Core, спроектированное для современных рабочих нагрузок центров обработки данных, таких как Python-среды с интенсивным ветвлением и выполнение кода в песочнице. Масштабируемая когерентная фабрика объединяет все 88 ядер Olympus на монолитной сетке, обеспечивая на 50% более быструю связь между ядрами, чем традиционные чиплетные конструкции. Vera также является первым центральным процессором, интегрирующим память LPDDR5X, обеспечивая на 40% меньшую пиковую задержку памяти по сравнению с x86, что крайне важно для своевременного извлечения и анализа данных.
Vera обеспечивает в 1,8 раза более высокую производительность агентной песочницы по сравнению с центральными процессорами x86. Этот существенный прирост напрямую приводит к увеличению пропускной способности токенов и улучшению пользовательского опыта для сложных ИИ-приложений. Тесно связанная с Rubin GPUs через когерентные по памяти соединения NVLink между чипами, Vera обеспечивает ускоренные рабочие процессы. Vera BlueField 4 STX дополнительно питает контекстную память и хранилище ИИ, предоставляя комплексное решение для вычислений, сетей и хранения данных для эпохи агентов.
Cosmos 3: ИИ, который понимает реальность
Nvidia представила Cosmos 3, омнимодальную мировую модель, разработанную для переопределения Physical AI. Эта фундаментальная система предоставляет роботам и автономным транспортным средствам глубокое понимание физического мира путем обработки богатого набора данных: видео, звука, текста и критически важных входных данных действий. Она создает надежное, целостное восприятие реальности для интеллектуальных агентов.
Cosmos 3 работает в беспрецедентном масштабе, обученный на ошеломляющих 20 триллионах токенов мультимодальных данных. Его обучающий корпус включает почти 4 миллиарда изображений, 400 миллионов реальных и синтетических видео, а также обширные наборы звуковых, текстовых и поведенческих данных. Это позволяет Cosmos 3 выходить за рамки простого наблюдения; он активно выводит «action data», позволяя системам предсказывать результаты и принимать сложные решения. Этот инновационный подход бесшовно объединяет традиционные мировые модели и модели действий в единую мощную структуру.
Nvidia укрепляет свою приверженность открытым инновациям, делая Cosmos 3 открытой моделью. Разработчики могут легко получить доступ к ее весам на Hugging Face и полному исходному коду на GitHub. Это демократизирует доступ к мощной отправной точке для достижений в робототехнике, сложных симуляциях и автономных системах, напрямую ускоряя более широкую революцию в физическом ИИ. Для получения более глубокой информации об экосистеме агентного ИИ Nvidia, включая Vera CPU, обратитесь к NVIDIA Unveils Vera, the CPU for Agents.
Ваш следующий ПК — это агент ИИ
Nvidia и Microsoft объединяются, чтобы «переосмыслить ПК впервые за 40 лет», представляя новаторский суперчип RTX Spark. Это сотрудничество знаменует собой глубокий сдвиг, превращая персональный компьютер из устройства, которое просто выполняет приложения, в устройство, которое бесшовно размещает и запускает нативные агенты ИИ. Эта инициатива принципиально переопределяет пользовательский опыт и само назначение персональных вычислений.
Характеристики Spark просто чудовищны, они разработаны для беспрецедентных локальных возможностей ИИ. Один чип объединяет мощный Blackwell RTX GPU, обладающий огромными 6144 ядрами CUDA, с настраиваемым 20-ядерным Grace CPU. Эта интегрированная мощь обеспечивает ошеломляющую производительность ИИ в один петаФЛОП, все это поддерживается массивной 128 ГБ унифицированной памяти, что устраняет традиционные узкие места в данных и позволяет выполнять сложные задачи ИИ.
Будущие ПК будут непрерывно и безопасно запускать персональные ИИ, работая полностью в локальной изолированной среде непосредственно на устройстве. Это обеспечивает как надежную конфиденциальность, так и постоянную функциональность для отдельных пользователей, предоставляя им интеллектуальную помощь без зависимости от облака. RTX Spark обеспечивает необходимую аппаратную основу для новой платформы Windows, специально созданной для обеспечения этого глубокого сдвига парадигмы в сторону повсеместных, агентных персональных вычислений.
Часто задаваемые вопросы
Что такое Nvidia Nemotron 3 Ultra?
Nemotron 3 Ultra — это новая, полностью открытая большая языковая модель Nvidia с 550 миллиардами параметров. Она разработана так, чтобы быть в 5 раз быстрее и на 30% дешевле в эксплуатации, чем сопоставимые открытые модели.
Почему Nvidia создала Vera CPU?
Nvidia создала Vera CPU специально для «эпохи агентов». Он разработан для устранения узких мест производительности традиционных CPU в рабочих процессах ИИ, действуя как дирижер для задач, интенсивно использующих GPU.
Для чего используется Nvidia Cosmos 3?
Cosmos 3 — это открытая базовая модель для «физического ИИ». Она помогает роботам, беспилотным автомобилям и другим физическим системам понимать, предсказывать и действовать в реальном мире, используя мультимодальные данные.
Что такое RTX Spark?
RTX Spark — это новый «суперчип», разработанный Nvidia и Microsoft для переосмысления ПК для эры ИИ. Он сочетает в себе мощный Blackwell RTX GPU и Grace CPU для запуска сложных агентов ИИ локально на вашем компьютере.