Skip to content

Este AI Conductor acaba de superar a Claude Fable 5

Una nueva IA de Tokio está superando a gigantes como Claude Fable 5, y no es solo otro modelo masivo. Fugu Ultra de Sakana AI utiliza un revolucionario sistema de 'orquestación' que podría cambiar la forma en que construimos sistemas inteligentes.

Nora Vance
Hero image for: Este AI Conductor acaba de superar a Claude Fable 5

Resumen / Puntos clave

  • Una nueva IA de Tokio está superando a gigantes como Claude Fable 5, y no es solo otro modelo masivo.
  • Fugu Ultra de Sakana AI utiliza un revolucionario sistema de 'orquestación' que podría cambiar la forma en que construimos sistemas inteligentes.

La frontera no es un solo modelo

El paradigma predominante de construir modelos de IA monolíticos cada vez más grandes está dando paso a una estrategia más sofisticada. La nueva frontera implica diseñar sistemas inteligentes que coordinen estratégicamente múltiples IA especializadas, prometiendo una mayor adaptabilidad y resiliencia frente a desafíos como los controles de exportación geopolíticos. Este cambio arquitectónico marca una desviación de los modelos singulares y que lo abarcan todo.

En el corazón de esta evolución se encuentra Sakana AI AI Fugu, un sistema de orquestación multiagente. Funcionando como un conductor LLM, Fugu está entrenado para enrutar dinámicamente las tareas entrantes al agente óptimo de un grupo intercambiable de otros LLM, incluyendo instancias recursivas de sí mismo. Este orquestador aprendido, impulsado por un modelo RL Conductor de 7B parámetros, maneja autónomamente la selección, delegación, verificación y síntesis de modelos, presentando una inteligencia unificada desde un único punto final de API.

Sakana AI AI entrega Fugu en dos niveles distintos, accesibles a través de una única API compatible con OpenAI. El modelo base Fugu equilibra un rendimiento sólido con baja latencia, sirviendo como un excelente predeterminado para aplicaciones cotidianas como la codificación con Codex o chatbots interactivos. Para problemas exigentes de varios pasos que requieren máxima precisión y profundidad, interviene Fugu Ultra. Ajustado para una calidad de respuesta máxima, coordina un grupo más profundo de agentes expertos, con una ventana de contexto de 1.0M tokens y una salida máxima de 131K tokens. Los primeros usuarios lo aplican para investigación de IA, producción de artículos y análisis de ciberseguridad.

Ganar sin jugar el mismo juego

Las corrientes geopolíticas ahora remodelan la frontera de la IA, destacadas por los controles de exportación de EE. UU. que revocaron el acceso público a Claude Fable 5 y Mythos Preview de Anthropic el 12 de junio de 2026. Esta medida encendió una demanda urgente de soberanía de la IA, obligando a naciones y empresas a asegurar un acceso resiliente y sin obstáculos a modelos avanzados.

El sistema Fugu de Sakana AI AI, lanzado el 22 de junio de 2026, responde directamente a este imperativo. Fugu no es un modelo monolítico más grande; en cambio, su núcleo es un modelo RL Conductor de 7B parámetros, un orquestador aprendido. Este sistema coordina dinámicamente un grupo de agentes de diversos LLM, incluso instancias recursivas de sí mismo, todo accesible a través de una única API compatible con OpenAI.

Esta arquitectura multiagente proporciona una cobertura crucial contra el bloqueo de un solo proveedor y las interrupciones geopolíticas. Si un modelo se bloquea o no está disponible, Fugu puede simplemente sortearlo, aprovechando otros agentes de su grupo. Esta adaptabilidad fomenta una infraestructura de IA más resiliente y versátil, garantizando un acceso continuo a capacidades de vanguardia y empoderando a empresas y naciones para mantener la independencia tecnológica. Fugu Ultra, su variante insignia, logra la máxima calidad de respuesta en problemas complejos de varios pasos, consolidando aún más el valor estratégico de Fugu.

Dominando las tablas de clasificación

Fugu Ultra dejó su huella de inmediato, superando decisivamente a Claude Fable 5 en LiveCodeBench, un benchmark dinámico para LLM centrados en código. El sistema de orquestación de Sakana AI AI logró una puntuación de 93.2, superando el 89.8 de Fable 5 en problemas de programación competitiva nuevos y controlados contra la contaminación. Esto demostró el potente dominio de Fugu Ultra sobre desafíos de codificación complejos.

Sin embargo, Fugu Ultra no reclamó un dominio universal. En SWE-Bench Pro, un benchmark diseñado para tareas de ingeniería de software de largo horizonte, Fable 5 mantuvo su liderazgo. Esta distinción aclara el enfoque de diseño de Fugu Ultra: sobresale en tareas individuales complejas, mientras que Fable 5 está diseñado específicamente para el desarrollo de software sostenido y de múltiples pasos.

En un espectro más amplio, Fugu Ultra demostró consistentemente sus capacidades superiores. Superó a otros modelos líderes como Opus 4.8, Gemini 3.1 Pro y GPT 5.5 en una amplia gama de evaluaciones. Estas incluyeron benchmarks para codificación, razonamiento e incluso humanidades, lo que subraya la versatilidad de su orquestación multiagente. Para una inmersión más profunda en su arquitectura, consulte Sakana AI Fugu: One Model to Command Them All.

De la teoría a la realidad: Fugu en acción

Las capacidades de Fugu Ultra se extienden mucho más allá de los benchmarks, demostrando una impresionante utilidad en el mundo real. El sistema llevó a cabo una investigación autónoma de aprendizaje automático, mejorando iterativamente la receta de entrenamiento de un pequeño modelo GPT. Durante más de 14 horas en una única H100 GPU, Fugu ejecutó más de 100 experimentos, descubriendo de forma autónoma mejoras en el tamaño del lote, la profundidad del modelo, la tasa de aprendizaje y la configuración del optimizador. Este agente también logró un notable retorno del 20% en una prueba de predicción de series temporales financieras.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Demostrando un razonamiento y una memoria superiores, Fugu Ultra sobresalió en tareas cognitivas complejas. En un desafío de ajedrez a ciegas, superó a un motor ELO de 2100, mostrando su profundidad estratégica. Además, el sistema escribió con éxito un solucionador funcional de Rubik's Cube desde cero, una hazaña en la que los modelos frontera competidores fallaron consistentemente en producir soluciones viables.

Más allá de la resolución abstracta de problemas, Fugu Ultra demostró una notable competencia en el razonamiento espacial y estructural. Generó un iris mecánico completamente funcional en CAD, un diseño de ingeniería intrincado. Esto contrastó fuertemente con los modelos competidores, que produjeron solo diseños defectuosos o no funcionales para la misma tarea, lo que subraya la capacidad única de Fugu Ultra en el diseño generativo práctico.

Preguntas Frecuentes

¿Qué es Sakana Fugu Ultra?

Sakana Fugu Ultra no es un modelo de IA único y monolítico. Es un sistema de orquestación multiagente que actúa como un 'director', delegando inteligentemente subtareas a un conjunto de modelos de IA especializados para resolver problemas complejos.

¿Cómo supera Fugu Ultra a modelos como Claude Fable 5?

La fuerza de Fugu Ultra proviene de su capacidad para seleccionar el mejor agente de IA para cada parte de una tarea. Al combinar las fortalezas de varios modelos y evitar sus debilidades, logra un rendimiento superior en benchmarks específicos y complejos como LiveCodeBench.

¿Cuál es la ventaja estratégica de la arquitectura de Fugu?

Su arquitectura promueve la 'soberanía de la IA' al reducir la dependencia de un único proveedor de modelos. Si un modelo deja de estar disponible debido a controles de exportación u otros problemas, Fugu puede simplemente redirigir las tareas a otros agentes de su conjunto, asegurando la resiliencia.

¿Es Fugu Ultra mejor que Claude Fable 5 en todo?

No. Si bien Fugu Ultra sobresale en muchos benchmarks para tareas complejas y de múltiples pasos, Claude Fable 5 fue diseñado específicamente para tareas agénticas de muy larga duración y aún supera a Fugu en benchmarks como SWE-Bench Pro que prueban esta capacidad.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Descubre más

Mantente a la vanguardia de la IA

Descubre las mejores herramientas de IA, agentes y servidores MCP seleccionados por Stork.AI.

P.S. ¿Construiste algo que vale la pena usar? Publícalo en Stork