En bref / Points clés
Le dogme du 'prompting' que nous avons tous mal compris
On a toujours dit à tout le monde d'utiliser des fichiers Markdown pour élaborer les instructions et le contexte des agents AI, un dogme qui s'est avéré fondamentalement faux. Cette bonne pratique de longue date vient de faire face à un défi radical, remodelant fondamentalement la façon dont les développeurs abordent l'ingénierie des prompts.
Un employé d'Anthropic a déclenché une tempête ce week-end avec un article prônant un passage complet à HTML pour le 'prompting' des agents. La révélation virale, qui a cumulé un nombre étonnant de 10 millions de vues, a soutenu que HTML offre une lisibilité humaine et une densité d'information largement supérieures à celles du Markdown, tout en restant entièrement lisible par les agents.
Plutôt que de simples murs de texte, HTML débloque une communication visuelle sophistiquée. Il permet de magnifiques graphiques, un formatage plus élaboré, des animations, des menus déroulants, des boutons et des couleurs vives. Cela permet aux utilisateurs de condenser beaucoup plus d'informations dans un espace d'écran réduit, rendant les 'prompts' complexes beaucoup plus faciles à analyser pour l'œil humain.
La sommité de l'AI, Andrej Karpathy, a rapidement republié les découvertes de l'employé d'Anthropic en accord. Cette approbation de haut niveau a immédiatement conféré une immense crédibilité à la méthode HTML, déclenchant une réévaluation rapide des stratégies de 'prompting' au sein de la communauté des développeurs. L'ère des instructions textuelles simples est révolue ; le langage riche et structuré du web alimente désormais l'AI.
Prompts axés sur l'humain : l'avantage HTML
La conception inhérente de HTML pour les pages web en fait un format supérieur pour les prompts axés sur l'humain, transformant les instructions AI d'un texte dense en interfaces visuellement organisées. Cette approche tire parti de la capacité de HTML à condenser de vastes quantités d'informations dans un espace d'écran minimal, un contraste frappant avec la sortie linéaire et textuelle de Markdown.
Fini le temps d'analyser des 'murs de texte' pour un contexte critique. HTML permet aux ingénieurs de 'prompts' d'intégrer un formatage sophistiqué directement dans leurs instructions, améliorant à la fois la compréhension et la vitesse grâce à une clarté visuelle accrue. Imaginez remplacer de longs paragraphes par : - Des tableaux structurés présentant des données complexes - Des menus déroulants interactifs pour la sélection de paramètres - Des cartes stylisées visuellement distinctes mettant en évidence les informations clés - Des graphiques intégrés pour une interprétation rapide des données
Cette clarté visuelle améliore considérablement l'expérience utilisateur humaine. Un 'prompt' Markdown riche en texte pourrait présenter un bloc détaillant les spécifications du produit, nécessitant une lecture et une interprétation attentives. Inversement, un équivalent HTML rend ces mêmes spécifications dans un tableau facilement scannable avec des indicateurs de statut codés par couleur, transmettant instantanément des détails cruciaux.
La vidéo de Matthew Berman, faisant référence à un article viral d'un employé d'Anthropic, met en lumière ce changement profond. L'article, qui a recueilli 10 millions de vues, a souligné la lisibilité humaine inégalée de HTML, tout en restant « entièrement lisible par les agents ». Cela permet une densité d'information que Markdown ne peut tout simplement pas égaler, transformant les 'prompts' complexes en tableaux de bord intuitifs et digestibles.
Le coût caché : payer la taxe de 10x tokens
Paradoxalement, le formatage riche de HTML entraîne un coût caché substantiel. Alors que les 'prompts' axés sur l'humain améliorent la clarté, ils gonflent considérablement la consommation de tokens. Les premiers utilisateurs rapportent que les 'prompts' HTML peuvent multiplier par 10 l'utilisation des tokens par rapport au Markdown simple.
Les développeurs qui créent des applications basées sur l'IA sont confrontés à des implications financières importantes. Chaque token traité par un grand modèle linguistique se traduit directement par un coût imputé à leur budget. Une augmentation décuple des tokens d'entrée signifie une augmentation décuple des coûts opérationnels, rendant les agents robustes basés sur HTML prohibitivement coûteux pour de nombreux déploiements à l'échelle de la production. Cette réalité économique impose une réévaluation minutieuse de la conception des prompts.
Ajoutant une couche d'intrigue, le post viral original prônant HTML comme nouvelle norme provenait d'un employé d'Anthropic. Ce détail a déclenché un "coin conspirationniste" parmi certains observateurs. Anthropic, un développeur majeur d'AI, tire directement profit d'une consommation de tokens plus élevée sur ses modèles comme Claude.
Les sceptiques suggèrent que l'entreprise bénéficie d'un virage, impulsé par la communauté, vers une méthode de prompting plus gourmande en ressources. Indépendamment de l'intention, le débat met en lumière l'économie évolutive de l'AI. Pour plus d'informations sur ce changement, consultez Thariq Shihipar on X: "HTML is the new markdown. I've stopped writing markdown files for almost everything and switched to using Claude Code to generate HTML for me. This is why." / X.
HTML vs. Markdown : Votre nouveau manuel de prompting
HTML ne détrône pas Markdown en tant que roi de tous les prompts d'AI. Il élargit plutôt la boîte à outils de prompting, offrant une arme spécialisée et puissante pour des cas d'utilisation particuliers. Ce n'est pas un remplacement, mais un ajout stratégique à votre arsenal de prompting.
Pour les tâches exigeant un contexte visuel complexe ou des éléments interactifs human-in-the-loop, HTML excelle. Imaginez des interfaces d'agent avec : - Des tableaux de bord dynamiques - Des visualisations de données interactives - Des panneaux de contrôle opérationnels complexes Ici, la capacité de HTML à condenser une vaste quantité d'informations dans un petit espace visuel justifie sa taxe de 10x tokens.
Markdown, cependant, reste le choix pragmatique pour les instructions simples et les opérations sensibles aux coûts. Les directives simples, le traitement de données brutes ou tout scénario où l'efficacité des tokens est primordiale bénéficient toujours de la structure légère de Markdown. Le choix dépend de l'équilibre entre la complexité visuelle et les dépenses opérationnelles.
Ce paysage en évolution signale une maturité dans l'interaction homme-AI. Nous dépassons les commandes textuelles rudimentaires pour nous diriger vers des interfaces plus riches et plus intuitives, où les agents interprètent non seulement les mots, mais aussi les canevas structurés et interactifs fournis par HTML. Cela marque une étape significative dans l'élaboration de collaborations plus puissantes entre les humains et l'intelligence artificielle.
Foire aux questions
Pourquoi HTML est-il considéré comme meilleur que Markdown pour les prompts d'AI ?
HTML permet une lisibilité humaine et une densité d'informations nettement meilleures. Il prend en charge des formatages avancés comme les tableaux, les graphiques et les éléments interactifs, rendant les informations complexes plus faciles à analyser pour les humains tout en restant entièrement compréhensibles pour les agents d'AI.
Qui a suggéré pour la première fois d'utiliser HTML pour les prompts d'AI ?
Un employé d'Anthropic, Thariq Shihipar, a popularisé l'idée dans un post viral sur X (anciennement Twitter). Le concept a gagné en crédibilité lorsqu'il a été approuvé par l'expert en AI Andrej Karpathy.
Quel est le principal inconvénient de l'utilisation de HTML pour le prompting d'AI ?
Le principal inconvénient est une augmentation massive de la consommation de tokens, potentiellement jusqu'à 10 fois plus qu'un prompt Markdown équivalent. Cela se traduit directement par des coûts d'API plus élevés pour les utilisateurs et les développeurs.
Devrais-je remplacer tous mes prompts Markdown par HTML ?
Pas nécessairement. HTML est mieux adapté aux systèmes complexes avec intervention humaine (human-in-the-loop) où la clarté visuelle et la densité d'information sont critiques. Pour les instructions simples basées sur du texte ou les applications sensibles aux coûts, Markdown reste une option viable et efficace.