Análise do Gemini 3.5 Flash: Mais Rápido, mas Mais Caro do que Você Pensa

Resumo / Pontos-chave

O Google afirma que o Gemini 3.5 Flash oferece desempenho de IA de ponta a uma velocidade incrível por menos.
Mas dados de terceiros revelam uma verdade chocante sobre seus custos reais e habilidades de codificação.

Velocidade Incrível, Benchmarks Desconcertantes

O Google elogia o Gemini 3.5 Flash por sua velocidade excepcional, um recurso de destaque que atinge 278 tokens por segundo. Esta velocidade notável posiciona o Flash significativamente à frente de concorrentes como GPT-5.5 e Opus 4.7, superando massivamente até mesmo modelos como Haiku e outras ofertas de código aberto da OpenAI. Se a saída bruta é a prioridade, o Flash lidera o grupo.

Internamente, os próprios benchmarks do Google sugerem que as habilidades de codificação do Flash se alinham com modelos de ponta. Os dados da empresa indicam um desempenho apenas alguns por cento atrás do GPT-5.5 no SW Bench Pro e no Terminal Bench. Ele até supostamente supera o Opus 4.7 no Terminal Bench em cerca de 10%, embora o Opus 4.7 ganhe uma vantagem no SW Bench Pro.

No entanto, uma análise independente da Artificial Analysis revela uma realidade contraditória. Avaliações de terceiros lançam dúvidas significativas sobre as alegações otimistas do Google, fornecendo uma avaliação menos lisonjeira das verdadeiras capacidades do Flash em áreas críticas.

No índice de codificação independente da Artificial Analysis, o Flash pontua um medíocre 45. Isso o coloca não apenas atrás de rivais formidáveis como Kimi K2.6, mas, surpreendentemente, também atrás do próprio modelo mais antigo do Google, Gemini 3.1 Pro. O desempenho do Flash em inteligência de codificação parece ser uma fraqueza significativa, não conseguindo atingir o "desempenho de fronteira" que o Google anuncia, apesar de sua velocidade impressionante.

O Preço de US$ 1.500 Que o Google Não Mencionou

O marketing do Google elogia o Gemini 3.5 Flash como notavelmente barato, com preço de apenas US$ 1,50 por milhão de tokens de entrada. No papel, isso posiciona o Flash como uma opção econômica, aparentemente superando rivais como Opus 4.7 e GPT-5.5. No entanto, essa alegação atraente desmorona dramaticamente sob testes no mundo real, revelando uma estrutura de custos significativamente diferente da que o Google anuncia.

Análise independente da Artificial Analysis expôs as verdadeiras despesas operacionais. Executar seu benchmark de inteligência padrão com o Flash custou impressionantes US$ 1.552. Este valor representa uma despesa 5,5 vezes maior do que seu predecessor, Gemini 3 Flash, e é 75% mais caro que o Gemini 3.1 Pro. Crucialmente, o Flash provou ser mais caro do que até mesmo modelos de maior desempenho como o GPT-5.5 quando usado para tarefas de alto raciocínio, onde o GPT-5.5 supera significativamente o Flash em codificação.

A razão subjacente para este custo exorbitante reside no comportamento extremamente faminto por tokens do modelo. Durante as avaliações agenticas, o Gemini 3.5 Flash teve uma média de 49 turnos por tarefa. Esta métrica é uma das mais altas registradas em todos os modelos testados, indicando um consumo agressivo de tokens de entrada. Uma taxa de queima de tokens tão alta eleva a conta final, tornando o preço inicial por token enganoso e negando seu valor percebido.

Conheça o Antigravity, o Clone do Codex do Google

O Google não apenas revelou o Flash; ele também lançou o Antigravity 2.0, um novo aplicativo de agente de codificação autônomo. Este aplicativo imediatamente impressiona os desenvolvedores com sua semelhança impressionante com potências existentes como Codex e Cursor. Afastando-se de sua encarnação anterior como um IDE, o Antigravity 2.0 agora funciona como um aplicativo dedicado, oferecendo uma interface familiar para gerenciar conversas de IA e projetos de codificação.

Testes iniciais revelam que o Antigravity 2.0 se destaca em tarefas mais simples focadas na UI. Quando solicitado a criar um site básico de café, o agente produziu um design visualmente atraente e funcional, superando até mesmo o Opus 4.7 em uma comparação direta. Isso sugere que as capacidades subjacentes do Flash são particularmente hábeis na geração de interfaces de usuário limpas e modernas, embora com uma leve "sensação de IA" caracterizada por estilos comuns de cartões e gradientes.

No entanto, o desempenho do agente diverge significativamente ao lidar com aplicações full-stack mais complexas, como um painel de controle de finanças pessoais. Embora o Antigravity 2.0 tenha gerado com sucesso uma aplicação funcional muito mais rapidamente, sua UI frequentemente parecia genérica e carecia do acabamento sofisticado visto nas saídas dos concorrentes. Isso indica uma disparidade em sua capacidade de lidar com design arquitetônico intrincado versus geração estética rápida e superficial.

O Gemini CLI está Morto. E Agora?

Em uma jogada disruptiva, o Google anunciou que desativará o Gemini CLI de código aberto em 18 de junho. Esta ação força os desenvolvedores a fazer a transição para o novo Antigravity CLI de código fechado, desenvolvido em Go. A mudança abrupta sinaliza uma clara mudança estratégica, afastando-se das iniciativas de código aberto contribuídas pela comunidade em direção ao ecossistema proprietário do Google.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Em última análise, o Gemini 3.5 Flash surge como uma oferta de nicho. Sua velocidade impressionante, atingindo 278 tokens por segundo, o torna uma excelente escolha para aqueles que priorizam o throughput bruto e capacidades agenticas avançadas. No entanto, seu fraco desempenho em codificação, com uma pontuação de apenas 45 no índice de codificação da Artificial Analysis (ficando abaixo de Kimi K2.6 e até mesmo de Gemini 3.1 Pro), juntamente com custos operacionais proibitivamente altos, o posicionam mal para o desenvolvimento geral. A Artificial Analysis descobriu que a execução do índice de inteligência custou $1.552, um valor impressionante de 5,5 vezes mais do que o Gemini 3 Flash e superando até mesmo o GPT 5.5 para tarefas de codificação de alto raciocínio.

Este lançamento aponta para uma potencial mudança estratégica para o Google. A empresa parece despriorizar o mercado de desenvolvedores de ponta e suas ferramentas de IA de última geração. Em vez disso, o Google parece concentrar seus formidáveis recursos de IA na integração perfeita desses avanços em sua vasta gama de produtos de consumo de massa, incluindo Search, Workspace e Android, visando um impacto mais amplo no usuário em vez da adoção por desenvolvedores especializados.

Perguntas Frequentes

O que é Gemini 3.5 Flash?

Gemini 3.5 Flash é o mais recente modelo de IA do Google, projetado para velocidade e eficiência. Ele apresenta uma janela de contexto de 1 milhão de tokens e capacidades multimodais, mas seu desempenho e custo no mundo real são temas de debate.

Gemini 3.5 Flash é melhor que GPT-5.5 ou Opus 4.7?

Depende da tarefa. Flash é significativamente mais rápido que ambos. No entanto, benchmarks de terceiros mostram que suas habilidades de codificação são mais fracas, e embora seja forte em fluxos de trabalho agenticos, não é um vencedor claro sobre modelos como Opus 4.7 em qualidade geral.

Por que Gemini 3.5 Flash é caro na prática?

Apesar de um preço baixo por token, o modelo é descrito como 'faminto por tokens'. Ele usa um grande número de tokens de entrada e iterações para completar tarefas, levando a custos reais significativamente mais altos para trabalhos complexos do que o seu preço sugere.

O que é Antigravity 2.0?

Antigravity 2.0 é o novo agente de codificação de IA autônomo do Google, substituindo a versão IDE anterior. Ele funciona de forma semelhante a outras ferramentas como Codex e Cursor, fornecendo uma interface para desenvolvimento de software assistido por IA.

Found this useful? Share it.

AI Reputation Report

What AI knows about you.

ChatGPT, Perplexity, Gemini, Claude & Grok are already answering questions in your category. Type your site, see who they name — you, or your competitor. Free preview.

Check my sitefree preview

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

A Nova IA do Google É Enganosamente Rápida

Velocidade Incrível, Benchmarks Desconcertantes

O Preço de US$ 1.500 Que o Google Não Mencionou

Conheça o Antigravity, o Clone do Codex do Google

O Gemini CLI está Morto. E Agora?

Perguntas Frequentes

O que é Gemini 3.5 Flash?

Gemini 3.5 Flash é melhor que GPT-5.5 ou Opus 4.7?

Por que Gemini 3.5 Flash é caro na prática?

O que é Antigravity 2.0?

What AI knows about you.

Leia a seguir

A Tomada Full-Stack da TanStack Chegou

Conheça o Rival de Claude: 30x Mais Barato

Claude Fingiu Sua Proficiência em Codificação?

Fique à frente da curva da IA