Skip to content

이 AI 지휘자가 Claude Fable 5를 이겼습니다

도쿄의 새로운 AI가 Claude Fable 5와 같은 거대 모델들을 능가하고 있으며, 단순히 또 다른 대규모 모델이 아닙니다. Sakana AI의 Fugu Ultra는 지능형 시스템 구축 방식을 바꿀 수 있는 혁신적인 '오케스트레이션' 시스템을 사용합니다.

Nora Vance
Hero image for: 이 AI 지휘자가 Claude Fable 5를 이겼습니다

요약 / 핵심 포인트

  • 도쿄의 새로운 AI가 Claude Fable 5와 같은 거대 모델들을 능가하고 있으며, 단순히 또 다른 대규모 모델이 아닙니다.
  • Sakana AI의 Fugu Ultra는 지능형 시스템 구축 방식을 바꿀 수 있는 혁신적인 '오케스트레이션' 시스템을 사용합니다.

프론티어는 하나의 모델이 아닙니다

점점 더 커지는 단일 AI 모델을 구축하는 지배적인 패러다임은 보다 정교한 전략으로 대체되고 있습니다. 새로운 프론티어는 여러 전문 AI를 전략적으로 조정하는 지능형 시스템을 설계하는 것을 포함하며, 지정학적 수출 통제와 같은 문제에 대한 향상된 적응성과 회복력을 약속합니다. 이러한 아키텍처 변화는 단일하고 포괄적인 모델에서 벗어나는 것을 의미합니다.

이러한 진화의 핵심에는 Sakana AI AI Fugu, 다중 에이전트 오케스트레이션 시스템이 있습니다. 지휘자 LLM으로 기능하는 Fugu는 재귀적 인스턴스를 포함하여 교체 가능한 다른 LLM 풀에서 들어오는 작업을 최적의 에이전트로 동적으로 라우팅하도록 훈련됩니다. 7B-파라미터 RL Conductor 모델로 구동되는 이 학습된 오케스트레이터는 모델 선택, 위임, 검증 및 합성을 자율적으로 처리하여 단일 API 엔드포인트에서 통합된 지능을 제공합니다.

Sakana AI AI는 단일 OpenAI-compatible API를 통해 접근 가능한 두 가지 Fugu 계층을 제공합니다. 기본 Fugu 모델은 강력한 성능과 낮은 지연 시간의 균형을 이루며, Codex를 사용한 코딩 또는 대화형 챗봇과 같은 일상적인 애플리케이션에 탁월한 기본값으로 사용됩니다. 최고의 정확성과 깊이가 요구되는 까다로운 다단계 문제의 경우, Fugu Ultra가 나섭니다. 최대 답변 품질을 위해 튜닝된 이 모델은 더 깊은 전문가 에이전트 풀을 조정하며, 1.0M 토큰 컨텍스트 창과 131K 토큰 최대 출력을 자랑합니다. 초기 사용자들은 이를 AI 연구, 논문 작성 및 사이버 보안 분석에 적용하고 있습니다.

같은 게임을 하지 않고 승리하기

지정학적 흐름은 이제 AI 프론티어를 재편하고 있으며, 2026년 6월 12일 Anthropic의 Claude Fable 5 및 Mythos Preview에 대한 공개 접근을 철회한 미국 수출 통제에 의해 극명하게 강조됩니다. 이러한 움직임은 AI 주권에 대한 긴급한 수요를 촉발하여 국가와 기업이 고급 모델에 대한 탄력적이고 방해받지 않는 접근을 확보하도록 강제합니다.

2026년 6월 22일 출시된 Sakana AI AI의 Fugu 시스템은 이러한 필수 요구 사항에 직접적으로 부응합니다. Fugu는 더 크고 단일한 모델이 아닙니다. 대신, 그 핵심은 7B-파라미터 RL Conductor 모델인 학습된 오케스트레이터입니다. 이 시스템은 다양한 LLM의 에이전트 풀을 동적으로 조정하며, 재귀적 인스턴스까지 포함하여 모두 단일 OpenAI-compatible API를 통해 접근할 수 있습니다.

다중 에이전트 아키텍처는 단일 공급업체 종속 및 지정학적 혼란에 대한 중요한 방어책을 제공합니다. 모델이 차단되거나 사용할 수 없게 되면 Fugu는 단순히 이를 우회하여 풀에 있는 다른 에이전트를 활용할 수 있습니다. 이러한 적응성은 보다 탄력적이고 다재다능한 AI 인프라를 조성하여 프론티어 기능에 대한 지속적인 접근을 보장하고 기업과 국가가 기술적 독립성을 유지할 수 있도록 지원합니다. Fugu의 주력 변형인 Fugu Ultra는 복잡한 다단계 문제에서 최대 답변 품질을 달성하여 Fugu의 전략적 가치를 더욱 확고히 합니다.

리더보드 장악

Fugu Ultra는 코드 중심 LLM을 위한 동적 벤치마크인 LiveCodeBench에서 Claude Fable 5를 결정적으로 능가하며 즉시 두각을 나타냈습니다. Sakana AI AI의 오케스트레이션 시스템은 신선하고 오염 통제된 경쟁 프로그래밍 문제에서 93.2점을 달성하여 Fable 5의 89.8점을 넘어섰습니다. 이는 Fugu Ultra가 복잡한 코딩 문제에 대한 강력한 지휘력을 보여주었습니다.

하지만 Fugu Ultra가 보편적인 우위를 주장한 것은 아닙니다. 장기적인 소프트웨어 엔지니어링 작업을 위해 설계된 벤치마크인 SWE-Bench Pro에서는 Fable 5가 선두를 유지했습니다. 이러한 차이는 Fugu Ultra의 설계 초점을 명확히 합니다. Fugu Ultra는 개별 복잡한 작업에 탁월한 반면, Fable 5는 지속적이고 다단계적인 소프트웨어 개발을 위해 특별히 제작되었습니다.

더 넓은 범위에서 Fugu Ultra는 지속적으로 우수한 역량을 입증했습니다. Opus 4.8, Gemini 3.1 Pro, GPT 5.5와 같은 다른 선도적인 모델들을 코딩, 추론, 심지어 인문학에 이르는 광범위한 평가 벤치마크에서 능가하며, 멀티 에이전트 오케스트레이션의 다재다능함을 강조했습니다. 아키텍처에 대한 자세한 내용은 Sakana AI Fugu: One Model to Command Them All을 참조하십시오.

이론에서 현실로: Fugu의 실제 적용

Fugu Ultra의 역량은 벤치마크를 훨씬 뛰어넘어 인상적인 실제 유용성을 보여줍니다. 이 시스템은 자율적인 머신러닝 연구를 수행하여 작은 GPT 모델의 훈련 레시피를 반복적으로 개선했습니다. 단일 H100 GPU에서 14시간 동안 Fugu는 100개 이상의 실험을 실행하며 배치 크기, 모델 깊이, 학습률 및 옵티마이저 설정에서 개선 사항을 자율적으로 발견했습니다. 이 에이전트는 또한 금융 시계열 예측 테스트에서 주목할 만한 20% 수익률을 달성했습니다.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

뛰어난 추론 및 기억력을 발휘하며, Fugu Ultra는 복잡한 인지 작업에서 탁월했습니다. 블라인드 체스 챌린지에서 2100 ELO 엔진을 능가하며 전략적 깊이를 보여주었습니다. 또한, 이 시스템은 루빅스 큐브 솔버를 처음부터 성공적으로 작성했는데, 이는 경쟁하는 최첨단 모델들이 실행 가능한 솔루션을 지속적으로 생성하지 못했던 업적입니다.

추상적인 문제 해결을 넘어, Fugu Ultra는 공간 및 구조적 추론에서 놀라운 숙련도를 보여주었습니다. CAD에서 완전히 기능하는 기계식 아이리스를 생성했는데, 이는 복잡한 엔지니어링 설계입니다. 이는 동일한 작업에 대해 결함이 있거나 기능하지 않는 설계만을 생성했던 경쟁 모델들과는 극명한 대조를 이루며, 실용적인 생성 설계에서 Fugu Ultra의 독특한 역량을 강조합니다.

자주 묻는 질문

Sakana Fugu Ultra는 무엇인가요?

Sakana Fugu Ultra는 단일의 거대한 AI 모델이 아닙니다. 이는 복잡한 문제를 해결하기 위해 전문화된 AI 모델 풀에 하위 작업을 지능적으로 위임하는 '지휘자' 역할을 하는 멀티 에이전트 오케스트레이션 시스템입니다.

Fugu Ultra는 Claude Fable 5와 같은 모델들을 어떻게 능가하나요?

Fugu Ultra의 강점은 작업의 각 부분에 가장 적합한 AI 에이전트를 선택하는 능력에서 나옵니다. 다양한 모델의 강점을 결합하고 약점을 피함으로써 LiveCodeBench와 같은 특정 복잡한 벤치마크에서 우수한 성능을 달성합니다.

Fugu 아키텍처의 전략적 이점은 무엇인가요?

이 아키텍처는 단일 모델 제공업체에 대한 의존도를 줄여 'AI 주권'을 촉진합니다. 수출 통제 또는 기타 문제로 인해 하나의 모델을 사용할 수 없게 되면, Fugu는 단순히 풀에 있는 다른 에이전트에게 작업을 라우팅하여 복원력을 보장할 수 있습니다.

Fugu Ultra가 Claude Fable 5보다 모든 면에서 더 나은가요?

아닙니다. Fugu Ultra는 복잡하고 다단계적인 작업을 위한 많은 벤치마크에서 탁월하지만, Claude Fable 5는 매우 장기적인 에이전트 작업을 위해 특별히 설계되었으며 이러한 역량을 테스트하는 SWE-Bench Pro와 같은 벤치마크에서는 여전히 Fugu를 능가합니다.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀더 알아보기

AI 트렌드를 앞서가세요

Stork.AIが엄선한 최고의 AI 도구, 에이전트, MCP 서버를 만나보세요.

P.S. 쓸 만한 걸 만드셨나요? Stork에 등록