Voir tous les articles de presse sur l'IA

Prenez le contrôle : comment empêcher l'IA Bard de Google d'apprendre de votre site Web

May 17, 2024

Introduction

Dans un monde où les données sont le nouveau pétrole, l'IA Bard de Google et d'autres modèles d'apprentissage automatique se régalent de contenu Web à des fins de formation. Mais maintenant, Google offre aux propriétaires de sites Web un moyen de se retirer de cette collecte de données. En ajoutant simplement une ligne à votre site Web robots.txt fichier, vous pouvez empêcher Google d'utiliser votre contenu pour former ses modèles d'IA. Cette décision fait suite à des préoccupations croissantes au sujet de la collecte de données éthiques et de la nécessité d'obtenir le consentement de l'utilisateur.

Le mécanisme

Si vous êtes propriétaire d'un site Web et que vous voulez vous désinscrire, le processus est simple. Tout ce que vous devez faire est d'interdire « User-Agent : Google-Extended » dans votre site robots.txt dossier. Ce fichier sert de guide aux robots d'indexation Web, leur indiquant à quelles parties de votre site Web ils peuvent ou ne peuvent pas accéder. Voici un guide sur la façon de modifier votre fichier robots.txt.

Préoccupations éthiques

Google prétend développer ses modèles d'IA de manière éthique, mais la réalité est un peu plus compliquée. Selon Danielle Romain, vice-présidente de la confiance de Google, la société a entendu des éditeurs Web qui veulent plus de contrôle sur la façon dont leur contenu est utilisé pour la formation en IA. Cependant, cela semble être une prise de conscience tardive, puisque Google et d'autres géants de la technologie ont déjà formé leurs modèles sur de grandes quantités de données sans le consentement explicite des utilisateurs.

Le pouvoir de choisir

La société présente cette nouvelle option comme un moyen pour vous « d'aider à améliorer les API génératives Bard et Vertex AI ». En d'autres termes, il ne s'agit pas de vous prendre quelque chose par Google ; il s'agit de savoir si vous êtes prêt à contribuer. Mais ce cadrage est problématique, étant donné que Google a déjà bénéficié d'un accès illimité aux données Web.

Autres plateformes qui prennent des mesures

Fait intéressant, Medium a également annoncé qu'elle bloquera tous ces robots jusqu'à ce qu'une solution plus granulaire soit disponible. Lire l'annonce de Medium ici.

L'essentiel

Bien que cette décision de Google semble être un pas dans la bonne direction, il est clair que le géant de la technologie rattrape son retard en matière de collecte de données éthiques. Si l'utilisation éthique des données était vraiment une priorité, ce paramètre aurait été disponible il y a des années.

FOIRE AUX QUESTIONS

Comment puis-je me désabonner de la formation Bard AI de Google ?

Vous pouvez vous désinscrire en ajoutant « Interdire : User-Agent : Google-Extended » à votre site Web robots.txt dossier.

Est-ce que cette décision de Google est vraiment éthique ?

L'éthique est discutable, puisque Google a déjà utilisé une grande quantité de données Web pour la formation sans consentement explicite.

Est-ce que d'autres plateformes font quelque chose de semblable ?

Oui, Medium a annoncé qu'elle bloquera ces robots d'indexation jusqu'à ce qu'une solution plus perfectionnée soit disponible.

Références

Articles récents

Voir tous les articles