Resumo / Pontos-chave
- Uma nova IA de Tóquio está superando gigantes como Claude Fable 5, e não é apenas mais um modelo massivo.
- O Fugu Ultra da Sakana AI usa um sistema revolucionário de 'orquestração' que pode mudar a forma como construímos sistemas inteligentes.
A Fronteira Não É Um Modelo Único
O paradigma predominante de construir modelos de IA monolíticos cada vez maiores está dando lugar a uma estratégia mais sofisticada. A nova fronteira envolve o design de sistemas inteligentes que coordenam estrategicamente múltiplas IAs especializadas, prometendo adaptabilidade aprimorada e resiliência contra desafios como controles de exportação geopolíticos. Essa mudança arquitetônica marca um afastamento dos modelos singulares e abrangentes.
No centro desta evolução está **Sakana AI AI Fugu**, um sistema de orquestração multiagente. Funcionando como um LLM condutor, o Fugu é treinado para rotear dinamicamente tarefas de entrada para o agente ideal de um pool intercambiável de outros LLMs, incluindo instâncias recursivas de si mesmo. Este orquestrador aprendido, alimentado por um modelo RL Conductor de 7B parâmetros, lida autonomamente com a seleção, delegação, verificação e síntese de modelos, apresentando uma inteligência unificada a partir de um único endpoint de API.
A Sakana AI AI entrega o Fugu em dois níveis distintos, acessíveis via uma única API compatível com OpenAI. O modelo base Fugu equilibra alto desempenho com baixa latência, servindo como um excelente padrão para aplicações diárias como codificação com Codex ou chatbots interativos. Para problemas exigentes e de várias etapas que requerem máxima precisão e profundidade, o **Fugu Ultra** entra em ação. Ajustado para máxima qualidade de resposta, ele coordena um pool mais profundo de agentes especialistas, ostentando uma janela de contexto de 1.0M tokens e uma saída máxima de 131K tokens. Usuários iniciais o aplicam para pesquisa de IA, produção de artigos e análise de cibersegurança.
Vencendo Sem Jogar o Mesmo Jogo
As correntes geopolíticas agora remodelam a fronteira da IA, destacadas pelos controles de exportação dos EUA que revogaram o acesso público ao Claude Fable 5 e ao Mythos Preview da Anthropic em 12 de junho de 2026. Essa medida acendeu uma demanda urgente por soberania de IA, compelindo nações e empresas a garantir acesso resiliente e desimpedido a modelos avançados.
O sistema Fugu da Sakana AI AI, lançado em 22 de junho de 2026, responde diretamente a este imperativo. O Fugu não é um modelo monolítico maior; em vez disso, seu núcleo é um modelo RL Conductor de 7B parâmetros, um orquestrador aprendido. Este sistema coordena dinamicamente um pool de agentes de diversos LLMs, até mesmo instâncias recursivas de si mesmo, todos acessíveis via uma única API compatível com OpenAI.
Esta arquitetura multiagente oferece uma proteção crucial contra o aprisionamento por um único fornecedor (single-vendor lock-in) e interrupções geopolíticas. Se um modelo for bloqueado ou ficar indisponível, o Fugu pode simplesmente contorná-lo, aproveitando outros agentes em seu pool. Essa adaptabilidade promove uma infraestrutura de IA mais resiliente e versátil, garantindo acesso contínuo a capacidades de ponta e capacitando empresas e nações a manter a independência tecnológica. O Fugu Ultra, sua variante principal, alcança a máxima qualidade de resposta em problemas complexos e de várias etapas, consolidando ainda mais o valor estratégico do Fugu.
Dominando as Tabelas de Classificação
O Fugu Ultra imediatamente deixou sua marca, superando decisivamente o Claude Fable 5 no LiveCodeBench, um benchmark dinâmico para LLMs focados em código. O sistema de orquestração da Sakana AI AI alcançou uma pontuação de 93.2, superando os 89.8 do Fable 5 em problemas de programação competitiva novos e com controle de contaminação. Isso demonstrou o potente domínio do Fugu Ultra sobre desafios complexos de codificação.
No entanto, Fugu Ultra não reivindicou domínio universal. No SWE-Bench Pro, um benchmark projetado para tarefas de engenharia de software de longo prazo, o Fable 5 manteve sua liderança. Essa distinção esclarece o foco de design do Fugu Ultra: ele se destaca em tarefas complexas individuais, enquanto o Fable 5 é construído especificamente para desenvolvimento de software sustentado e com várias etapas.
Em um espectro mais amplo, Fugu Ultra demonstrou consistentemente suas capacidades superiores. Ele superou outros modelos líderes como Opus 4.8, Gemini 3.1 Pro e GPT 5.5 em uma ampla gama de avaliações. Estas incluíram benchmarks para codificação, raciocínio e até mesmo humanidades, sublinhando a versatilidade de sua orquestração multiagente. Para um aprofundamento em sua arquitetura, veja Sakana AI Fugu: One Model to Command Them All.
Da Teoria à Realidade: Fugu em Ação
As capacidades do Fugu Ultra se estendem muito além dos benchmarks, demonstrando uma impressionante utilidade no mundo real. O sistema conduziu pesquisa autônoma em aprendizado de máquina, melhorando iterativamente a receita de treinamento de um pequeno modelo GPT. Em mais de 14 horas em uma única GPU H100, o Fugu executou mais de 100 experimentos, descobrindo autonomamente melhorias em batch size, model depth, learning rate e optimizer settings. Este agente também alcançou um notável retorno de 20% em um teste de previsão de séries temporais financeiras.
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
Exibindo raciocínio e memória superiores, Fugu Ultra se destacou em tarefas cognitivas complexas. Em um desafio de xadrez às cegas, ele superou um motor de 2100 ELO, demonstrando sua profundidade estratégica. Além disso, o sistema escreveu com sucesso um solucionador funcional de Cubo Mágico do zero, um feito onde modelos de ponta concorrentes falharam consistentemente em produzir soluções viáveis.
Além da resolução de problemas abstratos, Fugu Ultra demonstrou notável proficiência em raciocínio espacial e estrutural. Ele gerou uma íris mecânica totalmente funcional em CAD, um design de engenharia intrincado. Isso contrastou fortemente com os modelos concorrentes, que produziram apenas designs falhos ou não funcionais para a mesma tarefa, sublinhando a capacidade única do Fugu Ultra em design generativo prático.
Perguntas Frequentes
O que é Sakana Fugu Ultra?
Sakana Fugu Ultra não é um modelo de IA único e monolítico. É um sistema de orquestração multiagente que atua como um 'maestro', delegando inteligentemente subtarefas a um conjunto de modelos de IA especializados para resolver problemas complexos.
Como o Fugu Ultra supera modelos como o Claude Fable 5?
A força do Fugu Ultra vem de sua capacidade de selecionar o melhor agente de IA para cada parte de uma tarefa. Ao combinar os pontos fortes de vários modelos e evitar suas fraquezas, ele alcança desempenho superior em benchmarks específicos e complexos como o LiveCodeBench.
Qual é a vantagem estratégica da arquitetura do Fugu?
Sua arquitetura promove a 'soberania da IA' ao reduzir a dependência de um único provedor de modelo. Se um modelo se tornar indisponível devido a controles de exportação ou outros problemas, o Fugu pode simplesmente rotear tarefas para outros agentes em seu pool, garantindo resiliência.
O Fugu Ultra é melhor que o Claude Fable 5 em tudo?
Não. Embora o Fugu Ultra se destaque em muitos benchmarks para tarefas complexas e de várias etapas, o Claude Fable 5 foi projetado especificamente para tarefas agênticas de execução muito longa e ainda supera o Fugu em benchmarks como o SWE-Bench Pro que testam essa capacidade.
