En bref / Points clés
Vitesse fulgurante, benchmarks déroutants
Google vante Gemini 3.5 Flash pour sa vitesse exceptionnelle, une caractéristique remarquable atteignant 278 tokens par seconde. Cette vélocité remarquable positionne Flash significativement devant des concurrents comme GPT-5.5 et Opus 4.7, surpassant massivement même des modèles comme Haiku et d'autres offres open-source OpenAI. Si la production brute est la priorité, Flash est en tête.
En interne, les propres benchmarks de Google suggèrent que les compétences de codage de Flash s'alignent sur celles des modèles de premier ordre. Les données de l'entreprise indiquent une performance seulement quelques pourcents derrière GPT-5.5 sur SW Bench Pro et Terminal Bench. Il aurait même battu Opus 4.7 sur Terminal Bench d'environ 10%, bien qu'Opus 4.7 prenne l'avantage sur SW Bench Pro.
Pourtant, une analyse indépendante d'Artificial Analysis révèle une réalité contradictoire. Des évaluations tierces jettent un doute significatif sur les affirmations optimistes de Google, offrant une évaluation moins flatteuse des véritables capacités de Flash dans des domaines critiques.
Sur l'indice de codage indépendant d'Artificial Analysis, Flash obtient un score médiocre de 45. Cela le place non seulement derrière des rivaux redoutables comme Kimi K2.6 mais, étonnamment, aussi derrière l'ancien modèle Gemini 3.1 Pro de Google. La performance de Flash en intelligence de codage semble être une faiblesse significative, ne parvenant pas à atteindre la "performance de pointe" que Google annonce, malgré sa vitesse impressionnante.
Le prix de 1 500 $ que Google n'a pas mentionné
Le marketing de Google vante Gemini 3.5 Flash comme étant remarquablement bon marché, au prix de seulement 1,50 $ par million de tokens d'entrée. Sur le papier, cela positionne Flash comme une option économique, semblant sous-coter des rivaux comme Opus 4.7 et GPT-5.5. Cependant, cette affirmation attrayante s'effondre de manière spectaculaire lors de tests en conditions réelles, révélant une structure de coûts significativement différente de celle annoncée par Google.
Une analyse indépendante d'Artificial Analysis a révélé les véritables dépenses opérationnelles. L'exécution de son benchmark d'intelligence standard avec Flash a coûté la somme stupéfiante de 1 552 $. Ce chiffre représente une dépense 5,5 fois plus élevée que son prédécesseur, Gemini 3 Flash, et est 75% plus cher que Gemini 3.1 Pro. De manière cruciale, Flash s'est avéré plus coûteux que des modèles encore plus performants comme GPT-5.5 lorsqu'il est utilisé pour des tâches de raisonnement complexe, où GPT-5.5 surpasse significativement Flash en codage.
La raison sous-jacente de ce coût exorbitant réside dans le comportement extrêmement gourmand en tokens du modèle. Lors des évaluations agentiques, Gemini 3.5 Flash a enregistré en moyenne 49 tours par tâche. Cette métrique est l'une des plus élevées enregistrées parmi tous les modèles testés, indiquant une consommation agressive de tokens d'entrée. Un tel taux de consommation de tokens fait grimper la facture finale, rendant le prix initial par token trompeur et annulant sa valeur perçue.
Découvrez Antigravity, le clone de Codex par Google
Google n'a pas seulement dévoilé Flash ; il a également lancé Antigravity 2.0, une nouvelle application autonome d'agent de codage. Cette application frappe immédiatement les développeurs par sa ressemblance étrange avec des puissances existantes comme Codex et Cursor. S'éloignant de son incarnation précédente en tant qu'IDE, Antigravity 2.0 fonctionne désormais comme une application dédiée, offrant une interface familière pour gérer les conversations d'IA et les projets de codage.
Les tests initiaux révèlent que Antigravity 2.0 excelle dans les tâches plus simples axées sur l'interface utilisateur. Lorsqu'il a été invité à créer un site web de café basique, l'agent a produit un design visuellement attrayant et fonctionnel, surpassant même Opus 4.7 lors d'une comparaison directe. Cela suggère que les capacités sous-jacentes de Flash sont particulièrement aptes à générer des interfaces utilisateur propres et modernes, bien qu'avec une légère « sensation d'IA » caractérisée par des styles de cartes et de dégradés courants.
Cependant, les performances de l'agent divergent significativement lorsqu'il s'agit d'applications full-stack plus complexes, comme un tableau de bord de finances personnelles. Bien que Antigravity 2.0 ait réussi à générer une application fonctionnelle beaucoup plus rapidement, son interface utilisateur semblait souvent générique et manquait du raffinement sophistiqué observé dans les productions des concurrents. Cela indique une disparité dans sa capacité à gérer une conception architecturale complexe par rapport à une génération esthétique rapide et superficielle.
Le Gemini CLI est mort. Quelle est la suite ?
Dans une décision perturbatrice, Google a annoncé la fermeture du Gemini CLI open-source le 18 juin. Cette action contraint les développeurs à passer au nouveau Antigravity CLI, à source fermée, développé en Go. Ce changement abrupt signale un virage stratégique clair, s'éloignant des initiatives open-source contribuant à la communauté pour se diriger vers l'écosystème propriétaire de Google.
En fin de compte, Gemini 3.5 Flash apparaît comme une offre de niche. Sa vitesse fulgurante, atteignant 278 tokens par seconde, en fait un choix de premier ordre pour ceux qui privilégient le débit brut et les capacités agentiques avancées. Cependant, ses faibles performances en codage, avec un score de seulement 45 sur l'indice de codage d'Artificial Analysis (inférieur à Kimi K2.6 et même à Gemini 3.1 Pro), associées à des coûts opérationnels prohibitifs, le positionnent mal pour le développement général. Artificial Analysis a constaté que l'exécution de l'indice d'intelligence coûtait 1 552 $, soit un montant stupéfiant de 5,5 fois plus que Gemini 3 Flash et dépassant même GPT 5.5 pour les tâches de codage à haute raisonnement.
Cette publication indique un potentiel changement de stratégie pour Google. L'entreprise semble délaisser le marché des développeurs haut de gamme et ses outils d'IA de pointe. Au lieu de cela, Google semble concentrer ses formidables ressources d'IA sur l'intégration transparente de ces avancées dans sa vaste gamme de produits de consommation grand public, y compris Search, Workspace et Android, visant un impact utilisateur plus large plutôt qu'une adoption par des développeurs spécialisés.
Questions Fréquemment Posées
Qu'est-ce que Gemini 3.5 Flash ?
Gemini 3.5 Flash est le dernier modèle d'IA de Google, conçu pour la vitesse et l'efficacité. Il dispose d'une fenêtre de contexte de 1 million de tokens et de capacités multimodales, mais ses performances et son coût réels sont sujets à débat.
Gemini 3.5 Flash est-il meilleur que GPT-5.5 ou Opus 4.7 ?
Cela dépend de la tâche. Flash est significativement plus rapide que les deux. Cependant, les benchmarks tiers montrent que ses capacités de codage sont plus faibles, et bien qu'il soit fort dans les workflows agentiques, il n'est pas un vainqueur clair par rapport à des modèles comme Opus 4.7 en termes de qualité globale.
Pourquoi Gemini 3.5 Flash est-il cher en pratique ?
Malgré un faible prix par token, le modèle est décrit comme « gourmand en tokens ». Il utilise un grand nombre de tokens d'entrée et d'itérations pour accomplir les tâches, ce qui entraîne des coûts réels significativement plus élevés pour les travaux complexes que ce que son prix suggère.
Qu'est-ce que Antigravity 2.0 ?
Antigravity 2.0 est le nouvel agent de codage IA autonome de Google, remplaçant la version IDE précédente. Il fonctionne de manière similaire à d'autres outils comme Codex et Cursor, fournissant une interface pour le développement logiciel assisté par l'IA.