IA : Les sites web pourront refuser d'entraîner les algorithmes ?
Choses à Savoir TECH - A podcast by Choses à Savoir
Categories:
On le sait, des entreprises telles qu'OpenAI qui absorbent d'énormes quantités de données sans avoir l’autorisation des sources est un vrai problème. Cela a même suscité de nombreuses controverses, certaines se terminant par des poursuites judiciaires. Afin d'empêcher que les contributeurs ne voient leur travail utilisé sans autorisation, Google a décidé de lancer une fonctionnalité de blocage qui pourrait rencontrer un franc succès. Bien que Google soit pleinement impliqué dans le développement de l'intelligence artificielle avec Bard et son prochain modèle de langage Gemini, la société américaine semble vouloir apporter un peu d'ordre sur internet où les entreprises collectent sans aucun scrupule les données dont elles ont besoin. Elle vient ainsi d'annoncer son nouvel outil nommé "Google-Extended", qui permettra aux créateurs de contenu en ligne de continuer à indexer leur site tout en interdisant l'utilisation de leurs données par les développeurs d'intelligence artificielle. Comment cela fonctionnera-t-il ? Eh bien, Google-Extended sera accessible via le fichier robots.txt, le protocole d'exclusion des robots placé à la racine des sites web, qui indique quelles données peuvent être indexées ou non par les robots d'exploration. Les créateurs de sites web pourront ainsi indiquer leur souhait que leurs données ne soient pas collectées par les robots d'exploration des entreprises d'intelligence artificielle. Il s'agit d'une méthode similaire à celle choisie par le New York Times cet été, lorsque le journal américain avait explicitement interdit à OpenAI d'indexer ses données via le fichier robots.txt. Cette mise à jour majeure de Google devrait permettre d'obtenir le même résultat tout en préservant l'indexation sur le moteur de recherche de l'entreprise, une activité vitale pour la plupart des entités en ligne, mais qui va sans doute poser pas mal de problème aux éditeurs d’IA, ou tout du moins les forcer à obtenir les droits de leurs sources, et donc à rémunérer ces dernières. Learn more about your ad choices. Visit megaphone.fm/adchoices