TL;DR / Key Takeaways
Le Fantôme de Swarm : Pourquoi un Cadre Mort Tend à Être à la Mode
L'engouement pour Swarm explose à nouveau sur X, et ce n'est pas parce qu'OpenAI a secrètement ressuscité un cadre abandonné. Faites défiler les réseaux sociaux et vous verrez des clips viraux d'agents « style Swarm » effectuant des revues de code, des sprints de recherche et des workflows de bout en bout, chacun accumulant des milliers de likes et de tweets cités de développeurs IA à la recherche de la prochaine clé de productivité.
La confusion vient d'un simple décalage : marque versus réalité. Les influenceurs ne cessent de mentionner OpenAI Swarm et de teaser une mystérieuse “Mise à Jour de Swarm”, tandis que le véritable moteur derrière la plupart de ces démos est AgentKit, la nouvelle plateforme d'agents d'OpenAI, et non l'expérience de 2024 dont tout le monde se souvient.
Swarm lui-même était un petit cadre d'orchestration, presque au niveau jouet, qu'OpenAI a lancé en 2024. Il a montré comment vous pouviez connecter plusieurs agents sans état en moins de 100 lignes de Python en utilisant l'ancienne API de complétions de chat, passant le contrôle d'un agent à un autre comme un témoin.
Ce minimalisme a fait de Swarm une véritable aubaine pour les hackers et les éducateurs. Vous pouviez parcourir un seul fichier, comprendre l'ensemble du système et créer un exemple en quelques minutes, mais vous rencontriez également des limites strictes dès que vous essayiez de faire tourner quelque chose de sérieux dessus.
Swarm a été expédié sans essentielles de qualité production. Pas de mémoire intégrée, pas de traçage structuré, pas de garde-fous de sécurité, et pas de modèles définis pour les nouvelles tentatives, l'escalade, ou les points de contrôle avec intervention humaine—juste de simples transferts de prompt et une certaine logique de routage.
D'ici mars 2025, OpenAI a discrètement officialisé ce statut : Swarm a été déprécié et mis de côté. La documentation et les relations développeurs ont dirigé les utilisateurs vers le nouvel SDK d'agent, une base plus robuste qui servirait finalement de fondation à AgentKit.
Donc, lorsque les créateurs parlent d'une mise à jour Swarm 2025, ils parlent principalement de l'ambiance, et non d'une simple mise à jour de version. L'expression Swarm Framework est restée comme abréviation pour l'orchestration multi-agents, même après que la base de code originale ait cessé d'évoluer.
Ce qui a réellement changé la donne à la fin de 2025, c'est l'arrivée d'AgentKit. OpenAI a regroupé l'orchestration, la sécurité, l'observabilité et les intégrations dans une seule pile : des constructeurs visuels, des interfaces de chat à intégrer et un registre de connecteurs avec plus de 200 services.
Le cycle d'attente d'aujourd'hui se concentre sur cette pile, et non sur un dépôt zombie de 2024. Swarm est le fantôme de l'histoire - utile en tant que point de référence - mais le véritable intrigue appartient désormais à son successeur spirituel bien plus puissant.
Rencontrez AgentKit : le véritable jeu multi-agents d'OpenAI.
AgentKit est arrivé à DevDay le 6 octobre 2025 en tant que réponse d'OpenAI à une question que Swarm n'a jamais résolue : comment construire des systèmes multi-agents qui ne s'effondrent pas en dehors d'une démonstration ? Là où Swarm était un dépôt GitHub astucieux, AgentKit est une plateforme complète conçue pour s'intégrer dans des produits réels, avec de vrais utilisateurs et de vrais SLA.
Swarm est resté un prototype par conception. Il connectait des agents sans état en moins de 100 lignes de Python en utilisant l'ancienne API de complétion de chat, mais a été lancé sans couche de mémoire, sans traçage et presque sans sécurité. AgentKit renverse cette logique avec des paramètres par défaut affirmés pour l'observabilité, la politique et la mise à l'échelle, permettant ainsi aux équipes de passer du hackathon à la production sans changer de cadre en cours de route.
Au centre se trouve le Agent Builder visuel, une interface de type glisser-déposer qui ressemble davantage à Figma qu'à un terminal. Les développeurs enchaînent des planificateurs, des outils, des récupérateurs, des évaluateurs et des points de contrôle humains comme des nœuds, puis versionnent, testent et promeuvent ces flux comme tout autre artefact logiciel.
Agent Builder intègre également la configuration complexe laissée aux utilisateurs par Swarm. Vous définissez des magasins de mémoire à long terme, configurez des schémas d'outils, attachez des serveurs MCP et mettez en place des garde-fous au niveau du graphe, de sorte que chaque agent d'un flux de travail hérite par défaut du même ensemble de sécurité et de journalisation.
ChatKit transforme ces flux de travail en expérience utilisateur prête à être expédiée. Il offre aux équipes une interface de chat prête pour les applications—composants web, SDK mobiles et jetons de design—permettant à la même architecture d'agent d'alimenter des consoles internes, des copilotes destinés aux clients ou des widgets intégrés sans avoir à reconstruire l'interface à chaque fois.
Sous le capot, ChatKit gère l'état des sessions, l'identité des utilisateurs et l'isolation multi-tenant. Cela est important lorsque qu'un seul déploiement peut servir des milliers d'utilisateurs simultanés et des dizaines de types d'agents, chacun avec des autorisations, des outils et des périmètres de données différents.
Le Registre des Connecteurs est l'endroit où AgentKit se distingue de chaque clone inspiré par Swarm. OpenAI propose plus de 200 connecteurs prêt-à-l'emploi pour des systèmes tels que Dropbox, Google Drive, Slack, Microsoft Teams, Salesforce, Jira, GitHub et Snowflake, le tout géré depuis un espace de travail central.
Au lieu de créer manuellement des flux OAuth et des wrappers API fragiles, les équipes activent les connecteurs, cartographient les rôles et les champs, puis exposent immédiatement ces outils à des agents spécifiques. Les contrôles de politique et les journaux d'audit sont inclus, permettant aux équipes de sécurité de valider l'accès multi-agent aux données de production.
Pris ensemble, Agent Builder, ChatKit et le Connector Registry attaquent la fragmentation qui a jusqu'à présent défini l'IA agentique. AgentKit remplace un enchevêtrement de scripts sur mesure, d'interfaces utilisateur et de solutions d'intégration par une seule pile cohérente visant un seul objectif : transformer les expérimentations multi-agents en logiciels stables et soutenables.
Des LEGO à la logistique : Construire avec AgentKit
Le constructeur d'agents d'AgentKit ressemble moins à un IDE et plus à un studio d'automatisation sans code. Les développeurs glissent des blocs pour les planificateurs, outils, récupérateurs et évaluateurs sur une toile, les reliant comme des briques Lego. En arrière-plan, cela se compile en un graphe d'agents complet, mais en surface, vous réorganisez des nœuds colorés, sans jongler avec des rappels asynchrones et du code de liaison fragile.
Les flux de travail qui nécessitaient auparavant des centaines de lignes de logique d'orchestration tiennent maintenant sur un seul écran. Vous pouvez diriger une requête utilisateur vers un planificateur, la répartir entre plusieurs agents spécialisés, puis agréger leurs résultats en une réponse finale. Chaque lien du graphique est explicite, ce qui rend le débogage des transferts entre agents beaucoup moins opaque.
Les garde-fous humains sont intégrés directement dans cette interface. Vous ajoutez des points de contrôle de révision où un humain doit approuver une action, valider un appel d'outil ou annuler la décision d'un agent. Au lieu d'ajouter une modération à la passerelle API, vous modélisez visuellement les chemins d'escalade : « si risque élevé, mettre en pause et contacter le service juridique ».
Le pouvoir vient du Registre de Connecteurs, qui fonctionne comme une boutique d'applications pour les capacités des agents. OpenAI propose plus de 200 intégrations prêtes à l'emploi, couvrant : - Dropbox, Google Drive et Box pour l'accès aux fichiers - Slack, Teams et l'email pour les communications - Salesforce, HubSpot et divers CRM pour les données clients - GitHub, Jira et des outils CI pour les flux de travail d'ingénierie
Vous associez des connecteurs à des nœuds dans Agent Builder, de sorte qu'un agent "recherche" peut extraire des PDF de Dropbox tandis qu'un agent "support" interroge votre CRM. OAuth, la rotation des secrets et les portées restent centralisés dans le registre, et ne sont pas dispersés à travers des variables d'environnement et des scripts sur mesure.
Une fois qu'un graphique d'agent fonctionne, ChatKit le transforme en quelque chose que les utilisateurs peuvent toucher. Les développeurs intègrent des widgets ChatKit dans des applications web, des tableaux de bord internes ou des clients mobiles, avec un contrôle total sur la marque, les rôles et les permissions. Une seule interface ChatKit peut diriger différentes intentions vers différents agents en arrière-plan, de sorte que « rembourser cette facture » déclenche discrètement des automatisations financières tandis que « résumer ce document » touche un agent de travail des connaissances.
Pour plus de détails techniques, l'analyse d'OpenAI dans Présentation d'AgentKit - OpenAI Officiel passe en revue ces composants et leurs contraintes de production.
Conçu pour le combat : Sécurité de niveau entreprise et évaluations
Conçu pour des projets amateurs, Swarm n'a jamais eu à s'inquiéter des auditeurs ou des équipes de conformité. AgentKit, en revanche, doit le faire. OpenAI le présente comme un plan de contrôle de niveau entreprise pour les agents, avec la sécurité, l'observabilité et l'optimisation intégrées dès le premier appel API, et non ajoutées par la suite.
Là où Swarm a été expédié avec « moins de 100 lignes de code », AgentKit est livré avec des politiques. Chaque demande et appel d'outil passe par des garde-fous qui font respecter des règles à l'échelle de l'organisation : quelles données un agent peut toucher, quels connecteurs il peut utiliser, et à quelle vitesse il peut agir sans approbation humaine.
La protection des données passe d'un exemple GitHub à une exigence stricte. AgentKit intègre le masquage des informations personnelles, supprimant automatiquement les adresses e-mail, les numéros de téléphone, les identifiants de compte et d'autres identifiants des traces et des journaux, permettant ainsi aux équipes de déboguer des agents sans divulguer de données client dans les pipelines d'observabilité.
Les mèmes de jailbreak sur X rencontrent un environnement d'exécution beaucoup moins indulgent. AgentKit exécute des détections de jailbreak en plusieurs couches sur les invites, les pensées intermédiaires et les résultats des outils, bloquant les tentatives d'injection d'invites, les détournements de rôle et les schémas d'exfiltration de données avant qu'ils ne se propagent à travers un flux de travail multi-agents.
Au lieu que les développeurs prennent des captures d'écran des résultats inattendus, AgentKit s'appuie sur un cadre intégré Evals. Les équipes peuvent définir des ensembles d'évaluation, les exécuter à travers des agents et des outils, et comparer les exécutions au fil du temps tout en ajustant les invites, la logique de routage ou les modèles.
De manière cruciale, ces évaluations sont directement liées aux traces de production. Les développeurs peuvent : - Suivre chaque étape d'un Agent à travers les planificateurs, les récupérateurs et les outils - Attacher des scores provenant de correcteurs automatiques ou humains - Segmenter les performances par segment de clients, cas d'utilisation ou version du modèle
Ce cycle de rétroaction prépare la phase suivante : le réglage par renforcement. En novembre 2025, OpenAI a lancé une beta RFT qui permet aux équipes d'optimiser des stratégies de raisonnement sur mesure et des politiques d'utilisation d'outils en se basant sur des traces du monde réel, et non sur des références synthétiques.
RFT ne se contente pas de suggérer des invites. Il forme des modèles à choisir de meilleurs outils, à séquencer les appels plus efficacement et à éviter des étapes inutiles. Les premiers tests internes montrent que le 04 Mini fonctionne jusqu'à 30 % de manière plus efficace en termes de tokens dans des flux de travail complexes et lourds en outils lorsqu'il est ajusté avec ces signaux spécifiques aux agents.
En empilant tout cela, AgentKit ne ressemble plus à un jouet pour développeurs. Cela ressemble à une infrastructure.
De l'euphorie à la réalité : Comment les entreprises réussissent aujourd'hui
Les cycles de hype ne paient pas les factures ; expédier un produit le fait. AgentKit a déjà dépassé le stade de la preuve de concept, avec de vraies entreprises qui l’intègrent discrètement dans les parties de leur activité où la latence, la disponibilité et les dollars comptent réellement. Les chiffres provenant des premiers utilisateurs ressemblent moins à une démonstration en laboratoire et plus à un manuel de bonnes pratiques.
Le processeur de paiement Ramp est l'exemple le plus clair. En reconstruisant ses copilotes d'ingénierie internes sur l'architecture multi-agents d'AgentKit, Ramp rapporte avoir réduit ses cycles d'itération d'environ 70%. Cela signifie que les expériences de fonctionnalités, le triage des bugs et les mises à jour des outils internes se déroulent en jours au lieu de semaines, car les agents gèrent les revues de code, les vérifications de régression et les fils de documentation en parallèle.
Sous le capot, Ramp s'appuie sur des agents spécialisés plutôt que sur un assistant monolithique. Un agent planificateur divise le travail en sous-tâches, un agent d'outillage interagit avec les APIs CI/CD et d'observabilité, et un agent de documentation réécrit les spécifications et les journaux de modifications. Le registre de connecteurs d'AgentKit relie le tout, permettant à chaque agent de communiquer avec les mêmes dépôts de code, systèmes de billetterie et journaux sans une autre couche d'intégration fragile.
Coda met tout autant l'accent sur le côté client. Grâce à AgentKit, l'entreprise a automatisé environ deux tiers de ses tickets de support entrants, ne laissant que les cas les plus délicats à des humains. Les problèmes courants—confusion sur la facturation, accès à l'espace de travail, questions sur les modèles de base—sont traités par un agent de triage, un agent de récupération qui consulte des bases de connaissances, et un agent d'escalade qui signale toute incertitude.
De manière cruciale, Coda garde l'humain dans la boucle sans l'étouffer. Les agents rédigent des réponses, mettent en avant des documents pertinents et proposent des résolutions ; les représentants du support approuvent, ajustent ou remplacent. Des évaluations intégrées et des garde-fous surveillent l'exactitude, les taux d'hallucination et les scores de satisfaction client afin que le système s'améliore au lieu de dériver silencieusement.
Pris dans leur ensemble, ces indicateurs - des cycles d'ingénierie 70 % plus rapides, 66 % d'automatisation des tickets - transforment AgentKit d'un jouet de développement tape-à-l'œil en quelque chose d'autre : un kit d'outils reproductible et mesurable pour réduire les frictions opérationnelles à grande échelle.
La vague de l'IA agentique : c'est plus qu'un simple outil.
L'engouement autour d'AgentKit s'inscrit dans un changement beaucoup plus vaste prévu pour 2025 : l'IA passe de modèles uniques et polyvalents à des réseaux d'agents spécialisés qui coopèrent. Au lieu d'un prompt unique essayant de jongler avec la planification, l'utilisation d'outils et la vérification, des équipes mettent en place des agents planificateurs, des agents chercheurs, des agents exécutants et des critiques qui négocient sur le meilleur chemin à suivre.
Pensez à une colonie de fourmis, pas à un superordinateur. Plusieurs agents abordent un problème sous différents angles, partagent des progrès partiels et convergent vers des réponses plus rapidement qu'un seul système monolithique qui doit raisonner de bout en bout en une seule fois.
Les chercheurs formalisent cela avec une optimisation de style "colonie de fourmis" sur des essaims de LLM. Un article arXiv du 10 novembre a montré que les boucles de recherche multi-agents, de rétroaction et de vote peuvent atteindre des solutions de meilleure qualité avec moins d'échecs, notamment sur des tâches de raisonnement complexe et de codage.
Le hic : chaque agent supplémentaire ajoute une surcharge computationnelle. Chaque transfert signifie plus de jetons, plus de contexte à gérer, plus de traces à stocker. Les essaims naïfs font exploser la latence et le coût, avec des dizaines de sous-décisions et de tentatives pour chaque demande utilisateur.
Les modèles de nouvelle génération commencent à atténuer cette douleur. La pile multimodale de GPT-5 peut maintenir un contexte partagé entre les agents, acheminer les requêtes de manière efficace et compresser le raisonnement intermédiaire afin que les essaims ne se contentent pas de forcer le passage à travers les problèmes. OpenAI affirme que 04 Mini sous RFT est déjà 30 % plus efficace en termes de tokens dans les flux de travail à plusieurs étapes.
Les chiffres de l'industrie confirment pourquoi tout le monde court ici. Les indicateurs internes des sociétés de trading montrent que l'approche de sampling en essaim de Jensen augmente les récompenses quant de 94 %, tandis que les premiers adopteurs rapportent des cycles d'expérimentation 5 à 10 fois plus rapides lorsqu'ils passent d'agents uniques à des équipes coordonnées.
Les cabinets de conseil codifient cela dans le langage des conseils d'administration. McKinsey qualifie l'IA agentique de “la frontière ultime de la technologie”, prévoyant que les flux de travail alimentés par l'IA pourraient passer d'environ 3 % des processus d'entreprise aujourd'hui à 25 % d'ici la fin de 2025 si les systèmes multi-agents évoluent comme prévu.
Les écosystèmes se fragmentent et s'accélèrent en même temps. L'outil MPC d'Anthropic a explosé à plus de 200 composants construits par la communauté en six mois, tandis que des acteurs open source comme DeepSeek et Llama 3 poursuivent des stacks plus transparents et modifiables que l'AgentKit soigneusement sélectionné d'OpenAI.
Les développeurs en quête d'un contrôle de bas niveau exploitent toujours les idées originales du Swarm, le dépôt GitHub OpenAI Swarm servant de blueprint historique pour une orchestration légère, même si AgentKit et ses pairs définissent l'avenir de la production.
L'Arène Open-Source : AgentKit contre le Monde
AgentKit pourrait être le tout nouveau moteur d'OpenAI, mais il entre dans une arène qui ressemble davantage à Kubernetes en 2016 qu'à un monopole douillet. Les développeurs sont déjà divisés en factions : rester dans le jardin clos d'AgentKit d'OpenAI ou parier sur des architectures ouvertes et agnostiques aux modèles qui ne se démoderont pas avec la prochaine keynote de DevDay.
L'écosystème MPC d'Anthropic est devenu le contrepoids par défaut. Construit autour du Protocole de Contexte de Modèle, le MPC transforme les outils, les sources de données et les arrière-plans complets en capacités adressables sur le réseau que tout agent conforme peut appeler. Plus de 200 outils ouverts lancés en six mois signalent une philosophie très différente de celle du Registre de Connecteurs soigneusement sélectionnés d'AgentKit et de l'Agent Builder consensuel.
Alors qu'AgentKit promet une orchestration prête à l'emploi, MPC vend la composabilité. Vous pouvez intégrer Claude, GPT-5 ou un modèle Llama local dans le même flux de travail tant qu'ils parlent MPC. Cette flexibilité séduit les équipes déjà éprouvées par la migration hors de Swarm lorsque OpenAI l'a déprécié en mars 2025 et a redirigé tout le monde vers la nouvelle pile SDK d'agents.
Le verrouillage des fournisseurs n'est plus une préoccupation abstraite ; c'est un argument hebdomadaire X. Les développeurs soulignent qu’AgentKit couplé étroitement : - Le choix du modèle - La logique d'orchestration - La télémétrie et les évaluations - Les connecteurs et l'hébergement
Changer plus tard signifie reconstruire non seulement des requêtes, mais aussi des flux de travail entiers, des traces et des politiques de sécurité. Les défenseurs du MPC-first rétorquent que les protocoles ouverts vous permettent de changer de modèles ou de fournisseurs d'hébergement sans détruire la logique de votre agent.
Les concurrents open-source affinent cet argument. Deepseek propose des modèles optimisés, à faible coût, qui sont moins chers que le GPT‑4.1 et le GPT‑4.5 en termes de prix par jeton, tout en restant « suffisamment bons » pour de nombreuses charges de travail agentiques telles que les refontes de code, la tri des journaux et le routage de documents. Pour les équipes gérant des milliers d’agents simultanés, un delta de coût de 30 à 40 % compte plus que quelques points d’étalonnage.
Llama 3—souvent mal orthographié en tant que Llama 3 dans les discussions sociales mais restant la marque de modèle open de facto—s'ancre dans une stratégie différente : des agents auto-hébergés sur vos propres GPU ou VPC. Ce choix échange la pile de sécurité et les évaluations soignées d'AgentKit contre un contrôle total sur la résidence des données, la latence et le réglage fin. Les entreprises des secteurs financier et de la santé prototypent de plus en plus sur AgentKit, puis renforcent leurs infrastructures basées sur Llama une fois que les exigences se stabilisent.
Tout cela pousse AgentKit dans un rôle familier : le moyen le plus rapide de livrer quelque chose de concret, sans nécessairement viser la destination finale. Dans la vague d'IA agentique de 2025, la décision judicieuse pour les développeurs est de concevoir pour la portabilité — considérant AgentKit comme un puissant point d'accès dans un écosystème plus large, axé sur les protocoles, plutôt que comme le seul acteur en ville.
Le dilemme du développeur : Les pièges de la ruée vers l'IA
Les cycles de guerre AI de trente jours semblent palpitants jusqu'à ce que vous soyez celui qui expédie dans le rayon d'explosion. Les stacks agentiques passent maintenant d'un dépôt GitHub à la "production" en un week-end, poussés par les fondateurs à la recherche de captures d'écran pour les réseaux sociaux et les investisseurs exigeant des moments d'explosion de hype tous les mois. La qualité, les tests et la basic observabilité sont souvent loin derrière la démonstration.
Les systèmes multi-agents amplifient chaque angle aiguisé. Un seul agent en train d'halluciner est mauvais ; cinq agents transmettant des vérités partielles peuvent lentement corrompre un flux de travail entier. Les développeurs signalent davantage d'échecs du type « cela fonctionnait en staging » alors que les agents mal interprètent les sorties des uns et des autres, détournent les tâches ou tournent en boucle sur le même sous-objectifs jusqu'à atteindre les limites de taux.
Des hallucinations subtiles deviennent un problème structurel, et non pas un bug étrange du modèle. Les agents de planification peuvent inventer des outils qui n'existent pas, fabriquer des champs d'API ou inférer des permissions qui n'ont jamais été accordées. Dans un essaim, ces erreurs se propagent : un exécuteur fait confiance au planificateur, un récupérateur fait confiance à l'exécuteur, et la réponse finale semble soignée mais est incorrecte de manière à échapper à des tests superficiels.
Déboguer ce désordre est une discipline à part entière. Un flux de travail multi-agents non trivial peut générer des milliers d'événements de trace par requête : appels d'outils, tentatives de relance, révisions de planificateur, sous-décisions et messages entre agents. Les développeurs parlent de faire défiler des traces de 5 000 lignes juste pour comprendre pourquoi un seul ticket de support a été escaladé au lieu de se résoudre de manière autonome.
La latence explose également. Chaque agent supplémentaire ajoute de la latence au modèle, des échanges réseau et des frais généraux liés aux outils. Sans élagage impitoyable — moins d'agents, profondeur de planification limitée, mise en cache agressive — les équipes constatent que des flux de travail qui commençaient à 3 secondes s'étendent à plus de 30 secondes, puis expirent complètement lorsque le trafic réel des utilisateurs commence à affluer.
L'augmentation de l'échelle transforme ces désagréments en pannes. Dix utilisateurs interagissant avec un flux multi-agent est charmant ; 10 000 sessions concurrentes peuvent provoquer : - Des pics soudains de coût de jetons - Des tempêtes de limites de débit des API d'outils - Des arriérés dans les files d'attente qui se propagent à travers les services
L'opportunité reste énorme. Les systèmes multi-agents augmentent déjà de 10x le débit de certaines équipes, que ce soit dans les pipelines de révision de code ou dans le triage du support L2. Mais la mentalité de ruée vers l'or cache combien d'observabilité, d'évaluations et de simplifications impitoyables sont nécessaires pour empêcher ces essaims d'agents de s'effondrer sous leur propre complexité.
L'avenir est un essaim : à quoi ressemble 2026
Swarm pourrait être mort, mais 2026 semble se rapprocher davantage de son nom que de son code. Les agents d'IA sont en bonne voie pour devenir une couche d'interface utilisateur universelle, se positionnant au-dessus des applications et des API de la même manière que les navigateurs se situent au-dessus du HTML. Vous ne “ouvrirez pas Figma” ou “vous ne vous connecterez pas à Jira”, mais vous indiquerez à un agent de travail quel résultat vous souhaitez et vous le verrez orchestrer tout ce qui se trouve en dessous.
Les économies d'agents commencent à sembler réelles une fois que ces agents s'arrêtent d'être des copilotes ponctuels et commencent à se comporter comme des services persistants. Imaginez un dépôt où un essaim de agents spécialisés gère : - les échecs de CI et les tests instables - les mises à jour de dépendances et les correctifs de sécurité - le triage de régressions et les réversions tout cela sans qu'un humain touche la ligne de commande à moins qu'une véritable nouveauté ne se casse.
Ce n'est pas de la science-fiction ; c'est là où la courbe actuelle pointe. Les entreprises intégrant AgentKit dans leurs flux de travail de production aujourd'hui sont en fait en train de préparer les équipes de maintenance autonomes de 2026. La documentation comme OpenAI Platform - Documentation des agents ressemble moins à des notes SDK et plus à la fiche technique d'une nouvelle couche d'opérations.
Les dépenses d'investissement signalées par Meta d'environ 70 milliards de dollars sont le signe le plus clair. On ne dépense pas ce genre de fonds dans des centres de données juste pour améliorer légèrement le classement des fils d'actualités. On le fait pour héberger des essaims d'agents à l'échelle planétaire capables de soutenir le commerce, la modération, les outils de création et l'automatisation interne à un niveau où les humains deviennent des gestionnaires d'exceptions, et non des opérateurs principaux.
Avancez d'un an et l'infrastructure numérique complexe commence à ressembler à un jeu multijoueur dirigé par des équipes d'IA. Un groupe d'agents gère Kubernetes, un autre optimise les dépenses cloud en temps réel, un autre négocie des contrats API entre les services. Les humains définissent les politiques, examinent les tableaux de bord et interviennent lorsque les agents ne s'accordent pas ou s'écartent.
Si 2025 était l'année de la preuve que les systèmes multi-agents fonctionnent, 2026 sera celle où ils prendront discrètement en charge les aspects ennuyeux de la gestion d'Internet.
Votre prochaine étape : cessez de regarder, commencez à construire.
Arrête de faire défiler X et de rafraîchir sans cesse les fils de Swarm. Commence un dépôt, ouvre AgentKit, et configure un petit agent qui effectue une tâche pénible que tu répètes chaque jour : trier les problèmes GitHub, générer des listes de vérification pour les revues de PR ou résumer des rapports d'incidents. Déploie un outil interne rudimentaire en une semaine, puis renforce-le avec des journaux, des évaluations et de vrais utilisateurs au cours de la deuxième semaine.
AgentKit n'est pas un hommage nostalgique ni une mise à jour de Swarm déguisée. AgentKit est le moteur : le constructeur d'agents, ChatKit, le registre de connecteurs, et la pile d'évaluations qui transforment une démo réussie en un système durable. Swarm était une ébauche ; AgentKit est la chaîne de production.
Traitez les agents comme des multiplicateurs de force, et non comme des prédateurs de postes. Les équipes intégrant les agents dans les flux de travail existants constatent déjà des gains de 2 à 10 fois : files d'attente de support auto-résolues, bruit de CI filtré, suivis de ventes rédigés avant que les humains ne se réveillent. À part les prévisions à la McKinsey, vos propres metrics—MTTR, temps de cycle, tickets par personne—vous indiqueront rapidement si l'ensemble fonctionne.
Actions pratiques à envisager pour les développeurs :
- 1Choisissez un flux de travail avec des indicateurs clairs : SLA, taille du backlog, temps de traitement.
- 2Utilisez Agent Builder pour enchaîner un planificateur, un exécuteur d'appel d'outils et une étape d'approbation humaine.
- 3Branchez-vous à deux ou trois sources de données provenant du registre de connecteurs, pas vingt.
- 4Activez les évaluations et le suivi des notes dès le premier jour.
Pour les leaders technologiques, la question n'est pas « essaim ou pas » mais « couche d'agents ou statu quo ». Constituez une petite équipe agile avec un mandat de 60 à 90 jours, un vrai budget et un indicateur clé de performance précis : réduire le coût d'un processus clé de 30 % ou doubler le débit sans nouvelle embauche. Intégrez dès le premier sprint les éléments de verrouillage des fournisseurs, de confidentialité et de conformité, et non au dernier.
Vous n'avez pas besoin d'un projet ambitieux. Vous avez besoin d'un Agent opérationnel en production. Construisez quelque chose de petit avec AgentKit ce mois-ci, partagez ce qui ne fonctionne pas, et participez au débat sur à quoi devraient ressembler les systèmes multi-agents—avant que tout le monde ne décide de l'avenir sans vous.
Questions Fréquemment Posées
Qu'est-ce qu'OpenAI AgentKit ?
AgentKit est l'ensemble d'outils prêt à l'emploi d'OpenAI, lancé en octobre 2025, pour créer, déployer et gérer des systèmes d'IA mult-agents. Il comprend un constructeur visuel, des outils d'intégration de chat et un registre de connecteurs.
AgentKit est-il la nouvelle version d'OpenAI Swarm ?
Non. Swarm était un cadre expérimental déprécié en mars 2025. AgentKit est un tout nouveau successeur, plus puissant et de niveau entreprise, conçu pour des workflows de production réels, et non une mise à jour de Swarm.
Qu'est-ce que les systèmes d'IA à agents multiples ?
Les systèmes multi-agents impliquent plusieurs agents IA spécialisés collaborant pour résoudre des problèmes complexes qu'un seul agent ne peut pas gérer seul. Ils travaillent ensemble comme une équipe, divisant les tâches et partageant des informations.
Puis-je commencer à utiliser AgentKit aujourd'hui ?
Oui, AgentKit a été lancé lors du DevDay d'OpenAI le 6 octobre 2025 et est disponible pour les développeurs afin de créer et déployer des workflows agentiques. Des entreprises comme Ramp et Coda l'utilisent déjà en production.