Skip to content

L'IA fonctionne pendant 12 jours, clone parfaitement Excel

Un agent IA a reçu une seule instruction de six mots et a fonctionné pendant 12 jours d'affilée pour cloner Microsoft Excel. Le résultat est une réplique entièrement fonctionnelle, prouvant que les agents autonomes peuvent désormais gérer des tâches incroyablement complexes et de longue durée.

Nora Vance
Hero image for: L'IA fonctionne pendant 12 jours, clone parfaitement Excel

En bref / Points clés

  • Un agent IA a reçu une seule instruction de six mots et a fonctionné pendant 12 jours d'affilée pour cloner Microsoft Excel.
  • Le résultat est une réplique entièrement fonctionnelle, prouvant que les agents autonomes peuvent désormais gérer des tâches incroyablement complexes et de longue durée.

L'instruction de six mots qui a engendré une application

Matthew Berman a lancé une expérience révolutionnaire avec une instruction concise de six mots : '/goal clone Excel, full feature parity.' Cette instruction a mis un agent IA, surnommé « Codex », sur une mission ambitieuse de réplication du logiciel de feuille de calcul omniprésent de Microsoft. La tâche de l'agent n'était pas seulement d'imiter, mais d'atteindre une équivalence fonctionnelle complète.

Ce qui a suivi a marqué un bond significatif dans les capacités des agents IA autonomes. Codex a fonctionné sans supervision pendant plus de 12 jours, travaillant avec diligence vers son objectif avant que Berman n'arrête manuellement le processus. Cette persistance sans précédent a brisé les notions antérieures des agents IA comme des suiveurs d'instructions à cycle court, démontrant une capacité à soutenir des opérations complexes sur des périodes prolongées.

Cette expérience illustre un changement profond : les agents IA évoluent au-delà de l'exécution de commandes simples et séquentielles. Au lieu de cela, ils démontrent désormais une poursuite d'objectifs à long terme et une décomposition de tâches sophistiquée, décomposant indépendamment un objectif massif comme le clonage d'Excel. Codex a analysé chaque fonctionnalité de l'application de bureau Excel réelle, puis les a systématiquement répliquées dans sa propre version, prouvant sa capacité de développement complexe et autodirigé.

Déconstruction du clone Excel construit par l'IA

Invité par une commande laconique de six mots, l'agent IA, surnommé « Codex », s'est lancé dans une mission ambitieuse de douze jours. Il n'a pas seulement généré du code ; il a ouvert de manière autonome la version de bureau de Microsoft Excel directement sur la machine de Matthew Berman. Codex a ensuite analysé méticuleusement « chaque fonctionnalité » de l'application en direct, en déconstruisant ses mécanismes et son interface utilisateur.

Le résultat fut un clone Excel d'une précision étonnante. Berman a présenté ses fonctionnalités vérifiées, confirmant une réplication quasi parfaite des fonctionnalités de base. Les utilisateurs pouvaient ajuster et surligner des colonnes, entrer des formules comme « un plus deux » pour un résultat instantané, et même trier les données de manière transparente par ordre croissant. Ce n'était pas une maquette superficielle ; c'était une réplique profondément fonctionnelle.

Berman a exprimé son étonnement quant à la qualité, décrivant l'application construite par l'IA comme « magnifique » et « complète en fonctionnalités ». Il a noté son indistinguabilité visuelle de l'original pour les opérations de base, la proclamant « parfaite ». Ce processus autonome, fonctionnant pendant plus de 12 jours, souligne un bond significatif dans la capacité des agents IA à comprendre, répliquer et livrer des logiciels complexes.

La technologie permettant les tâches IA de plusieurs jours

Les agents IA autonomes émergent rapidement comme un changement fondamental, illustré par l'expérience de plusieurs jours de Berman. La capacité de ces systèmes à accomplir des tâches complexes et de longue durée a doublé environ tous les sept mois, repoussant les limites au-delà des invites simples et réactives. Ce progrès incessant transforme l'IA d'un moteur de requête-réponse en un collaborateur proactif et persistant.

À la base de cette persistance se trouvent des cadres d'agents et des harnais sophistiqués, comme LangChain. Ces architectures fournissent l'échafaudage crucial pour les opérations de longue durée, intégrant des outils externes et orchestrant des processus multi-étapes. Elles gèrent l'état interne, maintiennent un plan cohérent dans le temps et facilitent l'analyse itérative des tâches, permettant aux agents de naviguer dans des projets complexes comme un clone Excel complet.

Fonctionner sur plusieurs jours introduit des défis techniques importants : la dérive contextuelle et la surcharge de mémoire. Les modèles d'IA précédents avaient du mal à maintenir leur concentration et à retenir les informations pertinentes sur des sessions prolongées. Les conceptions d'agents modernes combattent ces problèmes grâce à des systèmes de mémoire avancés, des modules de planification hiérarchique et une récupération sélective des informations, garantissant que l'agent reste aligné avec son objectif initial et prévenant la dégradation des performances au fil du temps. Pour en savoir plus sur les développements connexes, consultez Codex is becoming a productivity tool for everyone - OpenAI.

Du clonage d'applications à la maîtrise des flux de travail

La démonstration de Berman de « cloner Excel » est un signal puissant, s'alignant sur une accélération plus large de l'industrie. Nous assistons à une augmentation rapide des outils de développement d'applications basés sur l'IA et des logiciels de productivité IA profondément intégrés, allant au-delà de la simple génération de code. Les agents évoluent de simples assistants à des participants actifs, capables d'analyser les logiciels existants, de comprendre l'intention de l'utilisateur et de piloter de manière autonome les cycles de développement.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Cette progression indique un avenir où les agents IA deviendront des collaborateurs logiciels persistants et porteurs d'identité. Ils géreront de manière autonome des flux de travail complexes, orchestrant des tâches à travers de multiples applications et services, minimisant l'intervention humaine. Le Hype Cycle 2025 de Gartner pour l'IA a identifié les agents comme l'une des technologies progressant le plus rapidement, prévoyant cette réalité de collaborateurs IA intégrés d'ici 2026.

Les changements économiques découlant de cette révolution agentique sont profonds, impactant chaque secteur. Le marché de l'IA agentique devrait connaître une croissance explosive, passant d'un montant substantiel de 5 milliards de dollars en 2024 à 200 milliards de dollars d'ici 2034. Cette expansion massive sera principalement tirée par l'automatisation d'entreprise, redéfinissant fondamentalement l'efficacité opérationnelle, les cycles d'innovation et la création de valeur dans toutes les industries à l'échelle mondiale.

Foire aux questions

Quelle invite a été utilisée pour que l'IA clone Excel ?

L'IA a reçu une invite simple de six mots de Matthew Berman : '/goal Clone Excel, full feature parity.' Cela a lancé l'ensemble du processus de plusieurs jours.

Combien de temps l'agent IA a-t-il fonctionné avant d'être arrêté ?

L'agent IA, appelé Codex, a fonctionné de manière autonome pendant plus de 12 jours avant que Matthew Berman ne l'arrête manuellement. Il a émis l'hypothèse qu'il aurait pu continuer beaucoup plus longtemps.

Que sont les agents IA autonomes ?

Les agents IA autonomes sont des systèmes capables de planifier, de raisonner et d'exécuter de manière indépendante des tâches complexes et multi-étapes sur des périodes prolongées sans intervention humaine directe. Ils évoluent de simples outils vers des « collaborateurs logiciels » persistants.

La version clonée d'Excel était-elle entièrement fonctionnelle ?

L'application clonée a démontré des fonctionnalités de base importantes, notamment des colonnes ajustables, des formules fonctionnelles, le formatage des cellules et le tri des données. Elle a été décrite comme « feature complete » pour les tâches de base présentées.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀En savoir plus

Gardez une longueur d'avance en IA

Découvrez les meilleurs outils IA, agents et serveurs MCP sélectionnés par Stork.AI.

P.S. Vous avez créé quelque chose d'utile ? Listez-le sur Stork