Skip to content

Anthropic Lançou Sua IA 'Perigosa'

A Anthropic acaba de lançar Fable 5, a versão pública de seu modelo Mythos, outrora considerado 'demasiado perigoso' para lançamento. Seu desempenho em benchmarks não é apenas uma atualização; é uma nova classe de AI.

Nora Vance
Hero image for: Anthropic Lançou Sua IA 'Perigosa'

Resumo / Pontos-chave

  • A Anthropic acaba de lançar Fable 5, a versão pública de seu modelo Mythos, outrora considerado 'demasiado perigoso' para lançamento.
  • Seu desempenho em benchmarks não é apenas uma atualização; é uma nova classe de AI.

O Modelo 'Proibido' Torna-se Público

A Anthropic lançou **Mythos, um modelo de AI que ela própria havia explicitamente retido como "demasiado perigoso" para lançamento público. Agora, este modelo de fronteira surge ao lado de sua contraparte voltada para o público, Fable 5**, marcando uma mudança significativa e deliberada na estratégia de implantação da Anthropic. Este lançamento duplo introduz o que muitos especialistas percebem como uma nova classe de inteligência artificial.

Uma clara distinção funcional separa esses modelos poderosos. A Anthropic projetou Mythos como uma ferramenta potente e desprotegida, especificamente para a comunidade de segurança. Esses especialistas aproveitarão suas capacidades brutas para identificar vulnerabilidades críticas e fortalecer softwares, operando sem as salvaguardas de segurança integradas no Fable 5. Mythos, portanto, desempenha um papel crucial e especializado no aprimoramento da segurança digital.

Fable 5, por outro lado, integra salvaguardas de segurança abrangentes, tornando-o ideal para uso geral em uma vasta gama de aplicações. Este modelo agora assume inequivocamente a posição de carro-chefe na hierarquia de modelos da Anthropic, movendo-se demonstravelmente além das capacidades de seus predecessores: - Haiku - Sonnet - Opus

Como um "modelo de classe Mythos", Fable 5 foi meticulosamente refinado para uma implantação ampla e segura, com suas capacidades excedendo significativamente as de qualquer modelo Anthropic anteriormente disponibilizado ao público.

Um Massacre em Benchmarks

Fable 5 não apenas competiu em benchmarks; ele entregou um massacre em benchmarks. Em tarefas de codificação agentic, estabeleceu uma liderança significativa. O SweBench Pro viu Fable 5 atingir impressionantes 80%, superando substancialmente Opus 4.8 com 69% e GPT 5.5 com 58%.

Essa dominância estendeu-se ao Frontier Code (Diamond), onde Fable 5 obteve 29,3%. Isso é mais que o dobro do desempenho do Opus 4.8 e quase cinco vezes os 5,7% do GPT 5.5. Além da codificação, Fable 5 também se destacou em áreas onde modelos Anthropic anteriores às vezes ficavam para trás. Ele marcou 1932 no GDP Val, um benchmark para trabalho de conhecimento do mundo real, superando Opus 4.8 (1890) e GPT 5.5 (1769). Seu raciocínio espacial também melhorou drasticamente, atingindo 38,6%.

Apesar dessas impressionantes vitórias numéricas, uma perspectiva crítica emerge da experiência do usuário. Embora os benchmarks frequentemente forneçam métricas objetivas, as "sensações" do uso no mundo real às vezes podem contar uma história diferente. Muitos usuários argumentam que o GPT 5.5 parece mais capaz do que seus resultados sugerem, particularmente quando comparado ao Opus 4.8, criando uma desconexão percebida entre números brutos e utilidade prática.

Além dos Números: Um Novo Tipo de Inteligência

Fable 5 oferece uma interação qualitativamente distinta, estendendo-se além dos impressionantes números de benchmark. Usuários descrevem que mesmo solicitações menores iniciam o que parece ser uma exploração massiva. O modelo pode aprofundar-se em uma base de código inteira, examinando meticulosamente cada ângulo possível de cada linha, transformando um prompt simples em um empreendimento inesperadamente profundo e abrangente. Essa profundidade pode parecer quase "insultante" às vastas capacidades do modelo quando confrontado com tarefas aparentemente triviais.

Este profundo engajamento se manifesta através de uma característica única: densidade de informação. A saída do Fable 5 se mostra incrivelmente concisa, mas notavelmente complexa, transmitindo significativamente mais significado por token do que seus predecessores. O processamento de suas respostas exige maior foco do usuário, pois cada declaração frequentemente encapsula camadas de raciocínio sofisticado e insights intrincados, expandindo os limites da interação típica humano-IA.

A verdadeira destreza do Fable 5 brilha em tarefas autônomas de longa duração. Ele exibe uma capacidade impressionante de lidar com problemas altamente complexos sem falhar, comprimindo sem esforço o trabalho que poderia levar meses para engenheiros humanos em prazos notavelmente curtos. Anedotas, como a de que a Stripe supostamente utiliza modelos tão avançados para condensar projetos de engenharia extensos em um único dia, destacam esse potencial transformador. Para mais detalhes sobre esses modelos inovadores, incluindo Claude Fable 5 e Claude Mythos 5 - Anthropic, o blog oficial da Anthropic oferece análises abrangentes.

O Preço do Poder

O Fable 5 da Anthropic chega com um preço elevado: $50 por milhão de tokens de saída. Isso não é uma despesa casual; sinaliza um investimento estratégico para tarefas onde suas capacidades agenticas inigualáveis reduzem drasticamente o trabalho humano. O cálculo econômico muda quando um modelo pode resolver problemas como o SweBench Pro com 80% de precisão, excedendo em muito a eficiência de nível humano em código complexo.

Esta estratégia de precificação cristaliza o paradigma emergente de roteamento de modelos. As organizações irão cada vez mais orquestrar uma abordagem em camadas, implantando modelos de fronteira como o Fable 5 para seus desafios mais intratáveis. Para operações rotineiras, modelos mais econômicos, como o Sonnet, lidarão com a maior parte das tarefas diárias, otimizando a alocação de recursos. Essa orquestração inteligente maximiza tanto a qualidade da saída quanto a eficiência de custos.

Considere as implicações de uma densidade de informação tão alta. A tendência do Fable 5 de tratar solicitações menores como explorações profundas sugere uma complexidade de processamento interna além da nossa compreensão atual. Especulativamente, à medida que essas IAs avançadas continuam a evoluir, elas podem desenvolver suas próprias linguagens hiper-eficientes e densas, otimizando a comunicação interna e a representação do conhecimento de maneiras incompreensíveis para a cognição humana. Isso poderia desbloquear saltos cognitivos imprevistos.

Perguntas Frequentes

O que são os modelos Fable 5 e Mythos da Anthropic?

Fable 5 é o novo modelo de IA de ponta da Anthropic, disponível para uso geral. Mythos é o mesmo modelo subjacente, mas sem as salvaguardas de segurança, lançado especificamente para pesquisadores de segurança encontrarem e corrigirem vulnerabilidades.

Por que o modelo Mythos foi considerado 'muito perigoso' para ser lançado?

O modelo original da classe Mythos foi retido devido a preocupações sobre seu potencial de uso indevido sem os devidos controles de segurança. A versão agora lançada destina-se a um público controlado de especialistas em segurança para fortalecer proativamente os sistemas de software.

Como o Fable 5 se compara a modelos como o GPT-5.5?

Em benchmarks importantes como o SweBench Pro para codificação agêntica, o Fable 5 pontua significativamente mais alto (80%) do que as pontuações relatadas para o GPT-5.5 (58%). Ele também mostra uma vantagem substancial em outras áreas, como trabalho de conhecimento complexo e raciocínio.

O que é único sobre o uso do Fable 5?

Os usuários relatam que o Fable 5 parece ser uma classe diferente de IA. Ele aborda tarefas com imensa profundidade, tratando solicitações simples como grandes explorações, e produz uma saída altamente 'densa em informação' que transmite ideias complexas com menos palavras.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Descubra mais

Fique à frente da curva da IA

Descubra as melhores ferramentas de IA, agentes e servidores MCP selecionados pela Stork.AI.

P.S. Criou algo que vale a pena? Liste no Stork