Skip to content

Google : Cessez d'être obsédé par les AI Models

Le dernier manuel AI de Google révèle une vérité crue : le modèle que vous utilisez ne représente que 10 % de votre succès. Les 90 % restants sont le 'harnais' que vous construisez, et c'est l'avenir du logiciel.

Nora Vance
Hero image for: Google : Cessez d'être obsédé par les AI Models

En bref / Points clés

  • Le dernier manuel AI de Google révèle une vérité crue : le modèle que vous utilisez ne représente que 10 % de votre succès.
  • Les 90 % restants sont le 'harnais' que vous construisez, et c'est l'avenir du logiciel.

Du Vibe Coding aux Systèmes Vérifiés

La récente MasterClass de 50 pages de Google sur le codage AI met en lumière une évolution cruciale dans le développement logiciel. Elle postule que le modèle AI lui-même ne représente qu'environ 10 % des résultats ; les 90 % restants résident dans le "harnais" — le contexte, les outils et la vérification construits autour de lui. Cette observation met en évidence que le codage AI est un spectre, pas un interrupteur binaire.

À une extrémité se trouve le Vibe Coding : un prompting rapide et à faible effort avec une planification minimale, validé par une vérification rapide du type « cela semble-t-il fonctionner ? ». Cette approche excelle pour les preuves de concept ou l'exploration initiale, permettant une itération rapide. Cependant, son manque de fiabilité inhérent et son absence de vérification le rendent impropre aux logiciels évolutifs et de qualité production en raison d'un risque significatif.

En progressant le long du spectre, le codage structuré assisté par AI implique des prompts plus détaillés et des vérifications ponctuelles. Le summum est l'Agentic Engineering, qui emploie un système ingénierisé de ressources, de workflows, de spécifications, d'évaluations automatisées et de portes de Continuous Integration (CI). Cette méthodologie privilégie la répétabilité et la fiabilité, assurant des sorties robustes et vérifiables pour les systèmes complexes.

Cette accélération de l'implémentation, passant de semaines à de simples minutes ou heures, refaçonne le Software Development Life Cycle (SDLC) piloté par l'AI. Les principaux goulots d'étranglement résident désormais aux extrémités : la collecte initiale des exigences et la validation finale. Alors que l'AI accélère drastiquement la génération de code, la qualité des spécifications pilotées par l'humain et la vérification rigoureuse deviennent les nouvelles contraintes critiques pour la production commerciale.

La Règle des 90 % : Pourquoi le 'Harnais' Est Primordial

Se concentrer sur le Large Language Model (LLM) lui-même passe à côté de l'essentiel. Le récent manuel de 50 pages de Google, mis en évidence dans la MasterClass de Cole Medin, révèle une formule critique pour construire des agents AI fiables : Agent = Model + Harness. Le LLM choisi représente environ 10 % de la performance d'un agent.

Quatre-vingt-dix pour cent de l'efficacité d'un agent provient de son harnais. Ce n'est pas abstrait ; c'est la couche méticuleusement conçue que vous construisez autour du modèle. Il définit : - Contexte : Informations et contraintes pertinentes. - Outils : Fonctions externes que l'agent peut appeler. - Garde-fous : Mécanismes de sécurité et limites comportementales. - Workflows de vérification : Tests et évaluations automatisés qui permettent l'auto-correction.

Ce concept représente une convergence à l'échelle de l'industrie dans les meilleures pratiques d'Agentic Engineering. Des entreprises comme Anthropic articulent des architectures similaires, mettant l'accent sur le système environnant plutôt que sur le modèle fondamental. Le harnais est la couche qu'une organisation contrôle et sur laquelle elle itère réellement.

La performance de l'agent repose fondamentalement sur le harnais. Être obsédé par des améliorations marginales des LLM tout en négligeant l'ingénierie de contexte robuste, l'intégration d'outils et la vérification rigoureuse est une fausse piste. Le harnais est l'endroit où la fiabilité réelle et les résultats reproductibles sont forgés.

Vous n'êtes Pas un Chef d'orchestre, Vous êtes un Orchestrateur

Le rôle du développeur évolue fondamentalement, passant d'un chef d'orchestre manuel de code à un orchestrateur de systèmes intelligents et autonomes. Il ne s'agit pas d'écrire chaque ligne de logique applicative ; il s'agit de concevoir toute la « fabrique » pilotée par l'AI qui génère, teste et affine le code de manière indépendante. Vous ne faites plus seulement du codage ; vous construisez l'environnement et la logique opérationnelle pour les agents AI.

La tâche principale d'un orchestrateur est de concevoir le harness lui-même, en créant l'échafaudage robuste autour du LLM qui représente 90% de la performance d'un agent. Cela implique de définir méticuleusement des spécifications formelles, de mettre en œuvre des tests automatisés complets et d'établir des portes de continuous integration (CI) rigoureuses. Ces garde-fous programmatiques permettent à l'agent de s'auto-corriger rigoureusement, de valider sa propre sortie et d'apprendre de ses erreurs sans intervention humaine constante.

Ce changement profond impacte considérablement le Software Development Life Cycle (SDLC). Un système bien orchestré permet à l'agent IA d'itérer de manière indépendante, accélérant la génération et le raffinement du code de plusieurs semaines à seulement quelques minutes ou heures. Cette approche proactive atténue considérablement le goulot d'étranglement traditionnel de la validation humaine, libérant les ingénieurs pour qu'ils se concentrent sur la définition de problèmes de plus haut niveau et l'architecture système, plutôt que sur le débogage manuel. Pour plus d'informations, consultez le livre blanc fondateur de Google, The New SDLC With Vibe Coding - Kaggle.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

L'économie imbattable de l'IA agentique

La construction d'un système d'IA efficace exige un recadrage économique fondamental. Considérez l'investissement initial dans un harness robuste comme une Capital Expenditure (CapEx). Cela englobe le temps d'ingénierie pour concevoir un contexte complet, intégrer des outils spécialisés, définir des garde-fous et mettre en œuvre une vérification automatisée rigoureuse. Contrastez cela avec les coûts variables et continus de consommation de jetons bruts, de débogage manuel continu et de retouches itératives, qui relèvent tous des Operational Expenditure (OpEx).

Un CapEx plus élevé dans le harness réduit considérablement l'OpEx à long terme. En concevant un système agentique fiable et reproductible, les organisations réduisent les dépenses futures en jetons, souvent de manière significative, car les agents itèrent de manière autonome. Plus important encore, elles minimisent les coûts de main-d'œuvre substantiels associés à l'intervention humaine continue, au dépannage des invites ad-hoc et à la validation des sorties peu fiables. Cet investissement stratégique dans un harness complet préempte le cycle sans fin du « vibe coding » qui ne s'adapte pas bien et épuise les ressources d'ingénierie.

Pour tout projet logiciel sérieux, la logique économique est indéniable. Les analyses de Google soulignent que la construction d'un processus systématique d'agentic engineering offre une rentabilité et une évolutivité supérieures par rapport à la dépendance aux invites manuelles. Ce n'est pas seulement une préférence technique ; c'est un impératif stratégique pour un développement piloté par l'IA durable et de haute qualité, garantissant que l'investissement initial génère des rendements composés tout au long du cycle de vie du système.

Foire aux questions

Quelle est la différence entre le vibe coding et l'agentic engineering ?

Le vibe coding consiste à utiliser des invites informelles avec une planification minimale, adapté au code jetable ou aux MVPs. L'agentic engineering est une approche systématique utilisant des spécifications, des outils et une vérification automatisée conçus pour créer un code fiable et prêt pour la production.

Qu'est-ce qu'un 'harness' d'IA ?

Le harness est l'ensemble du système que vous construisez autour d'un modèle d'IA. Il comprend le contexte spécifique, les outils, les garde-fous, les flux de travail de vérification et l'orchestration qui guident le modèle pour produire le résultat souhaité.

Pourquoi Google dit-il que le modèle d'IA ne représente que 10% du système ?

Bien que le modèle fournisse le raisonnement central, sa performance est majoritairement déterminée par la qualité du 'harness' (les 90% restants). Un harness bien conçu peut faire en sorte qu'un bon modèle fonctionne de manière exceptionnelle, tandis qu'un mauvais harness limitera même le meilleur modèle.

Comment l'agentic engineering modifie-t-il le rôle d'un développeur logiciel ?

Cela déplace le rôle du développeur d'un 'chef d'orchestre' qui écrit chaque ligne de code à un 'orchestrateur' qui conçoit, construit et maintient le système automatisé (le harness) qui permet à un agent AI d'écrire le code.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀En savoir plus

Gardez une longueur d'avance en IA

Découvrez les meilleurs outils IA, agents et serveurs MCP sélectionnés par Stork.AI.

P.S. Vous avez créé quelque chose d'utile ? Listez-le sur Stork