View all AI news articles

Assuma o controle: como impedir que a Bard AI do Google aprenda com seu site

May 17, 2024

Introdução

Em um mundo em que os dados são o novo petróleo, a IA Bard do Google e outros modelos de aprendizado de máquina estão se deliciando com o conteúdo da web para fins de treinamento. Mas agora, o Google está oferecendo aos proprietários de sites uma maneira de optar por não participar dessa coleta de dados. Simplesmente adicionando uma linha ao seu site robots.txt arquivo, você pode impedir que o Google use seu conteúdo para treinar seus modelos de IA. Essa mudança ocorre após crescentes preocupações com a coleta ética de dados e a necessidade de consentimento do usuário.

O mecanismo

Se você é proprietário de um site e deseja optar por não participar, o processo é simples. Tudo o que você precisa fazer é proibir “User-Agent: Google-Extended” no seu site robots.txt arquivo. Esse arquivo serve como um guia para os rastreadores da Web, informando quais partes do seu site eles podem ou não acessar. Aqui está um guia sobre como editar seu arquivo robots.txt.

Preocupações éticas

O Google afirma desenvolver seus modelos de IA de forma ética, mas a realidade é um pouco mais complicada. De acordo com Danielle Romain, vice-presidente de confiança do Google, a empresa ouviu editores da web que querem mais controle sobre como seu conteúdo é usado para treinamento de IA. No entanto, isso parece uma constatação tardia, já que o Google e outros gigantes da tecnologia já treinaram seus modelos em grandes quantidades de dados sem o consentimento explícito dos usuários.

O poder da escolha

A empresa enquadra essa nova opção como uma forma de você “ajudar a melhorar as APIs geradoras de IA da Bard e da Vertex”. Em outras palavras, não se trata de o Google tirar algo de você; é sobre se você está disposto a contribuir. Mas esse enquadramento é problemático, já que o Google já se beneficiou do acesso irrestrito aos dados da web.

Outras plataformas em ação

Curiosamente, a Medium também anunciou que bloqueará esses rastreadores universalmente até que uma solução mais granular esteja disponível. Leia o anúncio do Medium aqui.

A linha de fundo

Embora essa medida do Google pareça ser um passo na direção certa, está claro que a gigante da tecnologia está se atualizando quando se trata de coleta de dados éticos. Se o uso ético de dados fosse realmente uma prioridade, essa configuração estaria disponível anos atrás.

PERGUNTAS FREQUENTES

Como faço para não participar do treinamento Bard AI do Google?

Você pode desativar adicionando “Não permitir: User-Agent: Google-Extended” ao seu site robots.txt arquivo.

Essa medida do Google é realmente ética?

A ética é discutível, pois o Google já usou uma grande quantidade de dados da web para treinamento sem consentimento explícito.

Outras plataformas estão fazendo algo semelhante?

Sim, a Medium anunciou que bloqueará esses rastreadores até que uma solução mais refinada esteja disponível.

Referências

Recent articles

View all articles