overview
Step 3.7 Flash란 무엇인가요?
Step 3.7 Flash는 StepFun이 개발한 멀티모달 비전-언어 모델로, AI 개발자와 기업이 고빈도 AI 애플리케이션 및 에이전트를 구축하고 배포할 수 있도록 지원합니다. 1,960억 개 매개변수 언어 백본과 18억 개 매개변수 비전 인코더를 결합하여 네이티브 이미지 및 비디오 이해를 가능하게 합니다. 중국 AI 스타트업 StepFun이 개발한 이 1,980억 개 매개변수 희소 Mixture-of-Experts (MoE) 모델은 고빈도 프로덕션 워크로드 및 에이전트 사용 사례를 위해 설계되었습니다. 텍스트 및 이미지 입력을 모두 처리하여 텍스트 출력을 생성하며, 토큰당 약 110억 개의 매개변수를 활성화하고 초당 최대 400개의 토큰 처리량을 제공합니다. 핵심 기능으로는 대규모 재무 보고서 구문 분석 및 다단계 검색 루프 실행과 같이 지각, 검색, 추론을 결합한 에이전트 워크플로우 확장이 포함됩니다. Step 3.7 Flash는 또한 다중 파일 저장소 추적, 버그 격리, 기능적 코드 패치 생성과 같은 실시간 엔지니어링 작업을 위해 구축되었습니다. 제품 UI, 문서, 자연 장면과 같은 다양한 컨텍스트에서 이미지를 이해하는 시각 지능에 탁월하며, ClawEval-1.1과 같은 선도적인 벤치마크에서 도구 사용 및 오케스트레이션에서 높은 신뢰성을 보여줍니다. 이 모델은 256k 컨텍스트 창을 지원하여 광범위한 문서 및 대규모 코드베이스를 포함하는 장문 컨텍스트 생산성 작업에 적합합니다.