overview
Что такое Step 3.7 Flash?
Step 3.7 Flash — это мультимодальная визуально-языковая модель, разработанная StepFun, которая позволяет разработчикам ИИ и предприятиям создавать и развертывать высокочастотные ИИ-приложения и агенты. Она сочетает в себе языковую основу с 196 миллиардами параметров и визуальный кодировщик с 1,8 миллиардами параметров для нативного понимания изображений и видео. Разработанная китайским стартапом в области ИИ StepFun, эта разреженная модель Mixture-of-Experts (MoE) со 198 миллиардами параметров спроектирована для высокочастотных производственных нагрузок и агентных сценариев использования. Она обрабатывает как текстовые, так и графические входные данные для получения текстовых выходных данных, активируя примерно 11 миллиардов параметров на токен и обеспечивая пропускную способность до 400 токенов в секунду. Ее основные возможности включают масштабирование агентных рабочих процессов, которые сочетают восприятие, поиск и рассуждение, такие как анализ больших финансовых отчетов и выполнение многошаговых циклов поиска. Step 3.7 Flash также создана для инженерных задач в реальном времени, способна отслеживать репозитории с несколькими файлами, изолировать ошибки и генерировать функциональные патчи кода. Она превосходно справляется с визуальным интеллектом, понимая изображения в различных контекстах, таких как пользовательские интерфейсы продуктов, документы и природные сцены, и демонстрирует высокую надежность в использовании инструментов и оркестрации, лидируя в таких бенчмарках, как ClawEval-1.1. Модель поддерживает контекстное окно размером 256k, что делает ее подходящей для задач продуктивности с длинным контекстом, включающих обширные документы и большие кодовые базы.