Le flux de travail de codage IA de Ray Fernando : Un guide pour l'ingénierie contextuelle

💡

TL;DR / Key Takeaways

Les meilleurs codeurs en IA ne se contentent pas d'écrire de meilleurs prompts ; ils fonctionnent dans un système complètement différent. Découvrez le flux de travail 'context-first' qui sépare les amateurs des professionnels et transforme l'IA en un véritable copilote.

Pourquoi votre méthode de « demander et prier » échoue-t-elle ?

La plupart des développeurs rencontrent le même mur : vous ouvrez Cursor ou VS Code, démarrez Claude ou GPT-4, tapez une invite astucieuse et regardez-le cracher 200 lignes de code qui fonctionnent presque. Les 10 premières minutes semblent magiques. Les 2 heures suivantes disparaissent à corriger des erreurs de décalage, des importations manquantes et des fonctions qui ne correspondent pas à votre modèle de données réel.

Cette douleur provient d'un mode d'échec silencieux : la dégradation du contexte. Les grands modèles jonglent avec des dizaines de milliers de tokens, mais votre projet dépasse rapidement cela avec de multiples fichiers, des contrats API et des décisions de conception à moitié mémorisées. Au troisième ou quatrième prompt, l'IA ne "se souvient" plus pourquoi vous avez choisi Postgres plutôt que Firebase ou pourquoi les rôles des utilisateurs se trouvent dans un service séparé.

Le phénomène de dégradation apparaît lorsque le modèle réintroduit avec assurance d'anciens modèles que vous aviez déjà refactorisés. Vous lui demandez de mettre à jour le nouveau `BillingClient`, et il ressuscite le `StripeService` obsolète d'un message précédent. Il oublie les noms des variables d'environnement, réinvente des types, et s'éloigne discrètement de votre véritable architecture.

Cette dérive a un coût en aval brutal. Au lieu de passer en revue un différentiel serré et chirurgical, vous obtenez un mélange hétéroclite de changements : de nouvelles fonctions auxiliaires éparpillées dans les fichiers, de la logique dupliquée et un traitement des erreurs incohérent. Chaque passage de l'IA aggrave le désordre, si bien que le débogage cesse d'être une question de corriger un bug pour devenir une affaire de réconciliation de trois versions légèrement différentes de la même fonctionnalité.

Les développeurs signalent passer plus de temps à auditer les résultats de l'IA qu'à écrire eux-mêmes du code, en particulier sur les projets comptant plus de 5 à 10 fichiers. Vous constatez : - Des DTO dupliqués avec des formes conflictuelles - Des conventions de nommage divergentes pour le même concept - Des modifications silencieuses et disruptives des interfaces publiques

La sollicitation naïve masque également la complexité derrière une fausse confiance. Le modèle générera avec plaisir un flux OAuth "fonctionnel" qui ignore les jetons d'actualisation, PKCE ou un stockage approprié des jetons, vous laissant avec une vulnérabilité de sécurité qui semble correcte au premier abord. La même chose se produit avec les migrations de base de données, les tâches en arrière-plan et les couches de mise en cache.

Un flux de travail de codage IA sérieux considère le modèle comme une partie d'un système, et non comme un génie. Cela signifie planification, contexte de projet explicite et des amorces sensibles à la pile qui gardent l'IA ancrée dans votre véritable base de code plutôt que dans votre dernier message.

Changez votre état d'esprit : Devenez un ingénieur du contexte

Illustration : Changez votre état d'esprit : Devenez un ingénieur de contexte.

Passez de « solliciter un chatbot » à l'exploitation d'un système. C'est la philosophie fondamentale que Ray Fernando et Cole Medin reviennent sans cesse : la programmation d'IA sérieuse signifie que vous orchestrez des modèles, des outils et du contexte comme un ingénieur qui gère un pipeline, et non comme un utilisateur qui tape dans une boîte. Vous ne vous contentiez pas de demander du code ; vous façonnez ce que le modèle sait, voit et se souvient de votre projet.

L'ingénierie des invites traditionnelle se concentre sur un seul message : peaufiner une requête, ajouter des contraintes, peut-être coller un extrait de code. Cela aide, mais cela atteint rapidement ses limites car chaque interaction réinitialise la compréhension du modèle. Vous obtenez des réponses intelligentes à des questions étroites, pas un collaborateur qui comprend le dépôt, l'architecture et la feuille de route.

L'ingénierie du contexte renverse cela. Vous concevez la manière dont l'IA ingère votre pile : documents, schémas, API, flux de données et contraintes. Au lieu d'un seul prompt astucieux, vous construisez un cerveau de projet persistent en utilisant des outils tels que des indexeurs de dépôts, des résumés de projet et des "prompts système" structurés qui accompagnent chaque demande.

Les workflows de Ray considèrent la fenêtre de contexte—qu'il s'agisse de 8K, 32K ou 200K tokens—comme une ressource précieuse et rare. Il préconise de créer des artefacts à fort signal : un aperçu de l'architecture sur une page, des spécifications de fonctionnalités, des modèles de données et des cartes de dépendances. Ceux-ci existent sous forme de blocs de contexte réutilisables que vous intégrez dans Cursor, Claude ou des modèles de type GPT avant tout nouveau travail sur les fonctionnalités.

Pensez-y comme à la différence entre un ingénieur senior et un nouvel stagiaire. Le senior a lu les documents de conception, comprend les compromis et se souvient de cette migration étrange d'il y a six mois. Le stagiaire ne voit que le fichier que vous lui avez remis et n'a aucune idée de la raison pour laquelle tout est structuré de cette manière.

Les workflows uniquement basés sur des prompts transforment votre IA en stagiaire : réactif, myope, constamment surpris par les modèles existants. Les workflows conçus en fonction du contexte la transforment en développeur senior capable de raisonner à travers les modules, de détecter les régressions architecturales et de proposer des abstractions cohérentes. Même modèle, comportement radicalement différent.

Opérez votre pile d'IA comme une infrastructure, pas comme un jouet. Une fois que vous avez intégré que vous êtes un ingénieur de contexte, chaque partie de votre flux de travail change : la façon dont vous rédigez des documents, la manière dont vous structurez vos dépôts, et la façon dont vous communiquez avec le modèle.

Plan avant construction : Le mandat centré sur le projet

Les workflows basés sur des plans commencent par quelque chose de délibérément basique : un plan écrit. Ray Fernando considère cela comme non négociable ; il refuse d'ouvrir Cursor ou Claude tant qu'il n'a pas un document de projet qui ressemble à la fois à une mini spécification produit, un croquis d'architecture et un plan de test, le tout réuni en un seul document.

Ce document commence par des exigences fonctionnelles en langage simple. Il rédige des récits utilisateurs, des critères de "terminé" explicites, ainsi que des contraintes telles que des objectifs de performance, des budgets de latence ou un support de navigateurs, afin que le modèle ne puisse pas discrètement s'optimiser pour un mauvais objectif.

Vient ensuite le flux de données. Ray cartographie les entités, les entrées, les sorties et comment les données circulent dans le système : les charges utiles des requêtes, les schémas de base de données, les couches de cache, les API externes et les travaux en arrière-plan. Si une fonctionnalité touche à l'authentification, à la facturation et aux notifications, chaque étape est nommée et décrite avant même qu'une seule ligne de code n'existe.

Il verrouille alors les décisions concernant la pile technologique au lieu de laisser les paramètres par défaut du modèle. Le plan spécifie le langage, le framework, l'ORM, le système de file d'attente, les outils de test et la cible de déploiement, souvent jusqu'aux versions : « Next.js 15, React Server Components, Prisma avec PostgreSQL, Redis pour la limitation de taux, Vitest pour les tests unitaires, GitHub Actions pour l'intégration continue. »

Ray force également un passage sur les cas limites et les modes de défaillance. Il énumère des scénarios tels que « succès de paiement partiel », « réessais de webhook », « JWT obsolète » ou « synchronisation mobile hors ligne », et précise comment le système doit se dégrader ou se rétablir. Ces points deviennent ensuite des incitations aux tests et des vérifications de surveillance.

Ce document initial devient le contexte de référence pour toute la session d'IA. Il le colle dans une nouvelle conversation et le considère comme le contrat : chaque demande suivante fait référence à des sections du plan au lieu de réexpliquer le projet depuis le début.

Cette étape empêche le modèle d'inventer une architecture. Plus de surprises avec MongoDB quand vous vouliez Postgres, plus de microservices mystérieux quand vous souhaitiez un monolithe, pas d'authentification auto-générée si vous utilisez déjà Auth0. Le modèle ne peut "être créatif" que dans les limites que vous avez définies.

Vous pouvez voir cette discipline se dérouler dans ses constructions en direct et ses analyses approfondies sur le Canal YouTube Ray Fernando – AI Coding & Workflows, où le plan, et non l'invite, guide l'ensemble de la session de codage.

Maîtriser la mémoire de l'IA : le contexte comme ressource

Le contexte fonctionne comme la RAM pour votre programmeur pair IA : rapide, puissant et absolument fini. Les LLM modernes jonglent avec entre 8 000 et 200 000 tokens, mais cette fenêtre se remplit de manière surprenante dès que vous ajoutez du code d'intégration, des bibliothèques externes et vos propres services à moitié documentés. Traitez cet espace comme un budget, et non comme un puits sans fond.

La plupart des développeurs épuisent ce budget en collant des fichiers bruts jusqu'à ce que le modèle atteigne ses limites. Vous obtenez une compréhension partielle, des interfaces hallucinées et des réécritures "utiles" du mauvais module. L'approche de Ray Fernando inverse cela : vous investissez tôt dans un résumé de projet compact et riche en signaux qui accompagne chaque demande, permettant ainsi au modèle de se réorienter instantanément.

Les indexeurs de projet automatisés sont l'outil puissant ici. Au lieu de fournir 120 fichiers, vous générez une "table des matières" structurée qui peut représenter 2 à 5 % de la taille du dépôt mais qui encode 80 à 90 % de ce dont l'IA a besoin. Cet index peut inclure : - Architecture de haut niveau - Modules clés et leurs responsabilités - Modèles de données et relations - APIs externes et points d'intégration

Des outils tels que Cursor, Windsurf et des scripts CLI personnalisés peuvent maintenir cet index à mesure que le projet évolue. Les invites au niveau du dépôt de Cursor vous permettent de fixer ce résumé comme une instruction permanente, de sorte que chaque discussion, modification et commande "répare ça" passe par le même modèle mental partagé. Vous offrez effectivement à l'IA un document de conception persistant au lieu de réexpliquer votre pile depuis le début.

Les invites système agissent comme une couche de politique au-dessus de ce contexte. Dans Cursor, vous pouvez définir des règles telles que « ne jamais toucher à l'authentification », « préférer les composants React fonctionnels » ou « tout nouveau code doit inclure des tests Jest ». Ces garde-fous existent au-dessus des messages individuels, de sorte que l'IA les respecte même lorsque vous vous concentrez sur un petit changement.

Un contexte à fort signal surpasse toujours le volume brut. Un résumé d'architecture de 1 500 tokens, un schéma de données et une carte de routage seront plus performants que 20 000 tokens de contrôleurs, d'outils et de code mort non filtrés. Vous voulez que l'IA lise la carte, pas qu'elle se fraye un chemin à travers vos node_modules.

Le bruit affecte la performance du modèle bien avant d'atteindre la limite stricte des tokens. En créant un index de projet et un prompt de dépôt, vous comprimez votre code source en quelque chose qu'un modèle peut analyser de manière cohérente. C'est le passage de "coller des fichiers jusqu'à ce que ça casse" à l'exploitation d'un véritable flux de travail conçu pour le contexte.

Utilisez votre meilleur IA pour réfléchir, pas seulement pour taper.

La plupart des gens traitent leur modèle le plus intelligent comme un dactylo très rapide. Les ingénieurs de flux de travail comme Ray Fernando et Cole Medin le considèrent comme un architecte en chef. Vous ne payez pas Claude 3 Opus ou GPT-4 Turbo pour produire des boucles for ; vous les payez pour décider de ce qui devrait exister en premier lieu.

Utilisez votre modèle de premier ordre pour une réflexion à haute compression : conception de système, analyse des compromis et modes de défaillance. Demandez-lui de proposer plusieurs architectures, de les comparer et de justifier les choix autour des modèles de données, des frontières d'API et du déploiement. Faites-lui produire un spécification technique écrite : composants, responsabilités, interfaces, et un plan de mise en œuvre par étapes.

Ce « pass architecte » pourrait coûter quelques dollars en appels d'API, mais il facilite les raisonnements difficiles. Vous obtenez un plan avec des hypothèses explicites, des contraintes et des risques que vous pouvez vérifier comme un document de conception d'un ingénieur senior. Une fois que vous l'avez approuvé, vous congelez cette spécification comme la seule source de vérité pour tout ce qui suit.

Ensuite, vous passez à des modèles moins chers et plus rapides—Claude 3 Haiku, GPT-4o mini, ou l'assistant intégré de votre IDE AI—pour exécuter le plan. Fournissez-leur uniquement la portion pertinente des spécifications ainsi que les fichiers locaux, et demandez des diffs petits et expédiables : un seul module, un ensemble de tests ou un script de migration. Examinez, exécutez les tests et itérez à grande vitesse sans épuiser vos jetons premium.

Une pile typique pourrait ressembler à : - Claude 3 Opus / GPT-4 Turbo : architecture, spécifications, analyse de risque - Claude 3 Sonnet / GPT-4o : code au niveau des fonctionnalités, refactorisations, documentation - Claude 3 Haiku / GPT-4o mini : modèle de base, tests, modifications mineures

Ce modèle « concevoir puis exécuter » maximise la qualité et contrôle les coûts. Vous concentrez le raisonnement coûteux en quelques passages à fort signal, puis laissez des modèles standard gérer le codage répétitif. Vous réduisez également la variance : lorsque chaque changement se rattache à un plan approuvé, vous luttez contre moins de régressions mystérieuses et d'hallucinations induites par le contexte.

Au fil du temps, vous pouvez même régénérer la spécification lorsque les exigences évoluent, puis relancer uniquement les étapes d'implémentation concernées. Le résultat ressemble moins à une conversation avec un robot et plus à l'exploitation d'un système de construction pour des idées logicielles.

Diviser pour Régner : Génération de Sous-Agents pour la Clarté

Les flux de travail de codage modernes basés sur l'IA ressemblent de moins en moins à une simple fenêtre de discussion et de plus en plus à un petit studio de agents spécialisés. Chaque session de chat devient un atelier de travail ciblé sur une préoccupation spécifique, avec son propre contexte, son histoire et ses contraintes, au lieu d'un fil de discussion chaotique qui essaie de tout retenir.

Imaginez une fonctionnalité complète : des profils utilisateurs avec des avatars et des fils d'activité. Un agent se concentre uniquement sur le schéma de base de données et le modèle de données, un autre s'occupe de l'interface utilisateur React, et un troisième gère le câblage d'intégration et les contrats API.

Dans le fil de discussion sur la base de données, vous regroupez tout ce qui concerne les tables, les index et les migrations. Vous lui demandez de parcourir un schéma PostgreSQL, de générer des modèles Prisma et de réfléchir aux clés étrangères et aux performances, sans que des composants React ou du CSS ne viennent jamais polluer ce contexte.

Pendant ce temps, un thread React séparé gère la mise en page, la gestion de l’état et la structure des composants. Il peut plonger profondément dans les hooks, les props et les classes Tailwind, en se référant uniquement aux structures d’API que vous collez, et non à l’intégralité du code backend.

Cela reflète la manière dont les IDEs d'IA comme Cursor, Replit et GitHub Copilot Workspace vous poussent vers une réflexion multi-agents. Ils encouragent : - Un chat « architecte » pour la conception de haut niveau - Des chats « fichier » ou « diff » localisés pour des modifications spécifiques - Des indexeurs en arrière-plan qui mettent en avant uniquement le code pertinent

Les propres systèmes de Ray Fernando formalisent ce schéma avec une séparation de contexte implacable. Sa vidéo My Pro Claude Code Workflow – Ray Fernando montre comment il génère de nouvelles sessions Claude pour la conception de schémas, les contrats API et les flux d'interface utilisateur, puis les assemble à travers un brief de projet principal.

Cette approche combat directement la pollution du contexte, où une seule conversation chargée se transforme en décisions à moitié oubliées et en instructions contradictoires. En isolant les préoccupations, vous maintenez chaque instance de modèle « mentalement » étroite et à haut signal, ce qui réduit les hallucinations et les suggestions conflictuelles.

Votre conversation principale, de haut niveau, reste claire : objectifs, contraintes, jalons et compromis. Les sous-agents s’occupent du « comment », mais le fil conducteur protège le « pourquoi », agissant comme la source de vérité du projet.

Lorsque vous devez ajuster la direction, vous mettez d'abord à jour le plan directeur, puis vous faites remonter les changements dans les discussions spécialisées. Ce flux descendant transforme un tas d'instructions désordonné en un flux de travail explicite et multi-agents sur lequel vous pouvez réfléchir, déboguer et améliorer.

Code d'expédition, pas le chaos : La révolution des différences empilées

Les demandes de tirage massives générées par l'IA semblent impressionnantes jusqu'à ce que quelqu'un essaie de les examiner. Vous obtenez des différences de 800 lignes touchant 14 fichiers, mélangeant des refontes, de nouvelles fonctionnalités et des corrections apportées à la va-vite. Aucun humain, ni bot de propriétaire de code, ne peut valider de manière fiable ce type de changement, donc les équipes soit les acceptent sans vraiment les examiner, soit les bloquent indéfiniment.

Les flux de travail modernes en IA font face à ce chaos avec des diffs empilés. Au lieu d'un méga-commit, vous livrez une tranche verticale de travail sous la forme d'une séquence de petites modifications logiquement isolées : un ajustement de type ici, un nouvel assistant là, puis le câblage de la fonctionnalité, puis les tests. Chaque étape se compile, s'exécute et peut être livrée indépendamment.

Pratiquement, vous guidez le modèle à fonctionner au niveau du diff, et non au niveau du dépôt. Dites-lui : « Proposez un seul commit minimal qui n'ajoute que le modèle de données pour X. Pas de contrôleurs, pas d'interface utilisateur, pas de tests pour l'instant. » Ensuite, vous collez le diff git actuel, lui demandez de peaufiner uniquement ce patch et de s'arrêter dès que le changement semble examinable.

De bons flux de travail empilés se transforment en micro-invites explicites, par exemple :

1« Étape 1 : ajouter uniquement des interfaces et des types. »
2« Étape 2 : ajoutez des fonctions pures qui utilisent ces types. »
3« Étape 3 : s'intégrer aux points de terminaison existants. »
4« Étape 4 : ajoutez des tests et de la documentation pour le nouveau comportement. »

Chaque étape devient une branche ou un commit séparé que des outils comme GitHub, GitLab ou Phabricator peuvent afficher comme sa propre pile de diff. Les examinateurs voient un changement de 40 lignes qui “ajoute des helpers de validation,” et non une surprise de 400 lignes qui réécrit silencieusement l’authentification. Vous maintenez le contexte précis pour l'IA et pour les humains.

Les différences empilées transforment l'IA d'un simple flux de code en un générateur de changements contrôlé. Vous obtenez des zones d'impact plus petites, des retours en arrière plus simples, un historique git plus propre, et une révision de code réaliste, ce qui rend le code écrit par l'IA réellement sûr à intégrer dans la branche principale d'une équipe de production.

L'objectif final : Utiliser l'IA pour avoir moins besoin de l'IA.

La réalité contre-intuitive des bons workflows d'IA : ils vous rendent progressivement moins dépendant du modèle. Si votre configuration vous rend plus dépendant de l'autocomplétion et des fils de discussion chaque semaine, vous ne codez pas avec l'IA — vous lui confiez votre cerveau.

Traitez le modèle comme un partenaire socratique, et non comme un distributeur automatique. Après chaque changement significatif, demandez-lui d'expliquer ce que fait le code, pourquoi ce design plutôt qu'un autre, et où il risque probablement de rencontrer des problèmes. Incitez-le à se contredire : “Listez 3 faiblesses dans cette approche et proposez des modèles plus sûrs.”

Poussez le modèle à générer des artefacts que vous sauteriez normalement lorsque vous êtes pressé : diagrammes, documents et récits. Demandez-lui de produire : - Un diagramme de séquence pour votre pipeline de demandes - Une carte des flux de données pour vos entités clés - Un aperçu de l'architecture sur une page en anglais simple

Utilisez ces résultats comme matériel d'étude, pas comme décoration. Lisez les documents d'architecture qu'il génère, puis posez des questions de suivi comme : « Redessinez ce diagramme en supposant que nous fractionnons ce service » ou « Expliquez cela à un développeur junior en 5 points clés ». Vous formez votre propre modèle mental du système tandis que l'IA s'occupe du dessin et du formatage routiniers.

Déchargez agressivement la mémorisation. Au lieu d'essayer de vous souvenir de chaque fonction auxiliaire ou de chaque indicateur de configuration, demandez à l'IA de maintenir un index vivant : "Résumez les responsabilités de chaque module en 1 à 2 lignes." Cela transforme votre mémoire de travail limitée en un cache de concepts, et non en numéros de ligne.

Au fil des semaines, cela modifie l'équilibre des pouvoirs. Vous commencez à utiliser l'IA pour l'infrastructure — modèles types, migrations, cadres de test — tout en conservant la maîtrise de l'architecture, des invariants et des modes de défaillance. Le modèle devient un pair programmeur rapide, et non l'ingénieur principal.

Des workflows matures que Ray Fernando et Cole Medin recommandent poussent vers une éventuelle maîtrise. Vous devriez être capable d'esquisse une fonctionnalité, d'en mettre en œuvre 80 % sans aide, puis d'intégrer l'IA pour des refontes ciblées, des tests et des cas particuliers. L'objectif final : l'IA vous accélère, mais votre compréhension livre le produit.

Votre nouvelle réunion quotidienne avec votre co-pilote IA

Commencez votre journée en rédigeant un bref résumé de 3 à 5 phrases en langage simple : ce que vous construisez, pourquoi, et comment vous saurez que cela fonctionne. C'est votre contexte de départ. Incluez des contraintes : API cible, attentes en termes de performance et toutes les zones du code qui "ne doivent pas changer".

Ensuite, transformez ce texte promotionnel en une micro-spécification. Ajoutez une liste de contrôle de 3 à 7 résultats concrets, tels que "ajouter une pagination à l'endpoint /utilisateurs" ou "enregistrer toutes les tentatives d'authentification échouées". Vous avez maintenant un petit contrat auditable entre vous et votre co-pilote IA.

Maintenant, ouvrez une nouvelle session d'IA. Collez le plan, puis joignez ou collez les fichiers index de votre projet : cartes des routes, points d'entrée principaux, fichiers de schéma et configuration. Vous voulez que le modèle voie la structure de l'application, pas chaque utilitaire aléatoire.

Si votre IDE prend en charge le contexte de dépôt (Cursor, GitHub Copilot Workspace, Codeium), orientez-le vers le dépôt tout en mettant en avant le plan. Demandez au modèle de reformuler sa compréhension de la tâche en 5 à 10 points. Corrigez toute inexactitude, même de 10 à 20 %, car cette erreur se répercutera dans chaque suggestion.

Avec l'alignement verrouillé, dites à l'IA explicitement : « Implémentez cela sous forme de diffs empilés, un changement logique à la fois. » Votre réunion devient désormais une boucle de : - Proposer le prochain plus petit diff - Montrer les fichiers concernés - Générer le patch - Vous examinez et exécutez les tests

Insistez sur des correctifs qui tiennent sur un seul écran ou deux. Si un diff concerne plus de ~5 fichiers ou 150–200 lignes, renvoyez-le : « Divisez cela en étapes plus petites et révisables. » La présentation de Ray Fernando Arrêtez de pousser du code IA directement vers la branche principale – Ray Fernando explique précisément pourquoi cette discipline vous épargne l'enfer des fusions.

Après chaque diff accepté, demandez un résumé d'un paragraphe et une courte note de risque : migrations, changements de performance ou ajustements de l'API. Collez ce résumé dans votre message de commit. Votre historique git devient un changelog généré automatiquement au lieu de "wip encore."

Terminez la session en transformant le modèle en assistant de documentation. Indiquez-lui quels documents existent—README, référence API, ADRs—et demandez des modifications concrètes : nouvelles sections, exemples mis à jour, notes de dépréciation. Copiez ces changements dans votre dépôt de documentation comme un diff final et expédiez-le avec le code.

L'avenir est ici : Vous êtes maintenant un chef d'orchestre.

Vous n'êtes plus un dactylographe alimentant des lignes dans un moteur de prédiction ; vous êtes un chef d'orchestre dirigeant un orchestre de modèles, d'outils et d'automatisations. Le travail ne consiste plus à "écrire du code plus rapidement" mais à "concevoir un système qui livre de manière fiable un logiciel fonctionnel." Les frappes au clavier comptent moins que la façon dont vous façonnez le contexte, décomposez le travail et acheminiez la bonne tâche à la bonne IA au bon moment.

Le codage moderne en IA ressemble à l'exploitation d'une mini plateforme : un modèle de planification de haut niveau, des assistants conscients du dépôt, des générateurs de tests et des bots de refactorisation, tous connectés à votre éditeur et à votre CI. Les ingénieurs les plus compétents pensent déjà en flux de travail : lancez un agent « exigences », un agent « conception », puis un agent « diff » qui ne touche qu'une seule branche fonctionnelle. Vous ne demandez pas à un seul modèle de tout faire ; vous orchestrez un pipeline.

Les développeurs qui prospéreront seront ceux qui considèrent l'IA comme une infrastructure, et non comme un simple outil de complétion automatique. Ils posséderont : - Un plan de projet documenté avant toute fonctionnalité majeure - Un ensemble de sessions d'IA spécialisées pour l'architecture, l'implémentation et la révision - Une discipline de diffs empilés qui permet de rendre chaque changement révisable et réversible

Les IDEs d'IA s'efforcent de rendre cette orchestration native. Des outils comme Cursor, GitHub Copilot et Replit regroupent déjà l'indexation des dépôts, les refactorisations conscientes des tests et les modifications multi-fichiers dans un seul flux. Attendez-vous à ce que des concepts de premier ordre tels que « plan de fonctionnalités », « profil de contexte » et « pile de révisions » soient ajoutés à côté de « Exécuter » et « Déboguer » dans votre éditeur dans les 12 à 24 mois à venir.

L'écart ne sera pas l'accès aux modèles ; tout le monde disposera de LLMs à peu près similaires. L'écart sera sur qui peut concevoir des systèmes robustes alimentés par l'IA qui survivent à la complexité du monde réel, au contrôle des versions et aux flux de travail d'équipe. Cet écart est déjà visible dans les équipes où un ingénieur expédie discrètement 3 à 5 fois plus de code revu et prêt pour la production en exploitant un pipeline IA discipliné.

De vieilles habitudes — agir sans réfléchir, des différences de 1 000 lignes, aucune planification — ne se contentent pas de faire perdre du temps ; elles vous sabotent activement. Commencez à agir comme un chef d'orchestre : établissez d'abord un plan, créez un contexte, générez des sous-agents, organisez vos différences et utilisez l'IA pour vous en rendre moins dépendant. L'avenir des logiciels n'est pas « l'IA écrit du code pour vous » ; c'est vous, dirigeant l'orchestre qui rend l'IA digne d'être utilisée.

Questions Fréquemment Posées

Qu'est-ce que l'« ingénierie du contexte » dans la programmation IA ?

C'est la pratique de structurer et de fournir des informations sur le projet (plans, diagrammes, résumés) à un modèle d'IA afin de s'assurer qu'il a une compréhension précise et riche en signaux de la base de code avant de générer du code.

Pourquoi une approche « projet d'abord, et non pas invite d'abord » est-elle préférable ?

Cela impose d'abord une planification et une documentation de haut niveau, ce qui conduit à un code généré par l'IA plus cohérent, précis et maintenable, réduisant ainsi le travail de reprise et le débogage.

Quels outils sont les meilleurs pour ce flux de travail avancé en IA ?

Les environnements de développement intégrés (IDE) natifs à l'IA comme Cursor sont idéaux. Ils intègrent des fonctionnalités telles que l'indexation de projets, les conversations multi-agents et les diffs empilés qui soutiennent directement les workflows axés sur le contexte.

Comment ce flux de travail vous aide-t-il à dépendre de moins en moins de l'IA avec le temps ?

En utilisant l'IA pour documenter et comprendre votre propre pile technologique, vous construisez un solide modèle mental de la base de code. Cela vous permet de mettre en œuvre des fonctionnalités plus simples vous-même, en utilisant l'IA uniquement pour des tâches plus complexes et novatrices.

𝕏 in ↑↗

Frequently Asked Questions

Pourquoi votre méthode de « demander et prier » échoue-t-elle ?

Qu'est-ce que l'« ingénierie du contexte » dans la programmation IA ?

C'est la pratique de structurer et de fournir des informations sur le projet à un modèle d'IA afin de s'assurer qu'il a une compréhension précise et riche en signaux de la base de code avant de générer du code.

Pourquoi une approche « projet d'abord, et non pas invite d'abord » est-elle préférable ?

Quels outils sont les meilleurs pour ce flux de travail avancé en IA ?

Les environnements de développement intégrés natifs à l'IA comme Cursor sont idéaux. Ils intègrent des fonctionnalités telles que l'indexation de projets, les conversations multi-agents et les diffs empilés qui soutiennent directement les workflows axés sur le contexte.

Comment ce flux de travail vous aide-t-il à dépendre de moins en moins de l'IA avec le temps ?

Votre flux de travail en IA pour le codage est erroné.

TL;DR / Key Takeaways

Pourquoi votre méthode de « demander et prier » échoue-t-elle ?

Changez votre état d'esprit : Devenez un ingénieur du contexte

Plan avant construction : Le mandat centré sur le projet

Maîtriser la mémoire de l'IA : le contexte comme ressource

Utilisez votre meilleur IA pour réfléchir, pas seulement pour taper.

Diviser pour Régner : Génération de Sous-Agents pour la Clarté

Code d'expédition, pas le chaos : La révolution des différences empilées

L'objectif final : Utiliser l'IA pour avoir moins besoin de l'IA.

Votre nouvelle réunion quotidienne avec votre co-pilote IA

L'avenir est ici : Vous êtes maintenant un chef d'orchestre.

Questions Fréquemment Posées

Qu'est-ce que l'« ingénierie du contexte » dans la programmation IA ?

Pourquoi une approche « projet d'abord, et non pas invite d'abord » est-elle préférable ?

Quels outils sont les meilleurs pour ce flux de travail avancé en IA ?

Comment ce flux de travail vous aide-t-il à dépendre de moins en moins de l'IA avec le temps ?

Frequently Asked Questions

Read Next

Le nouvel agent d'Anthropic vient de tuer le no-code

Cet Outil Dompte les Agents IA Chaotiques

La mémoire parfaite de l'IA est arrivée

Stay Ahead of the AI Curve