Microsoft supprime un blog incitant à entraîner l'IA sur des versions piratées des livres de Harry Potter
Microsoft a supprimé un blog après avoir été accusé d’avoir encouragé l’utilisation de livres piratés, notamment les tomes de la série Harry Potter, pour entraîner des modèles d’intelligence artificielle. Le contenu, qui avait été publié sur le site de la société, présentait un ensemble de données comprenant des textes issus de la série, mais avait été incorrectement étiqueté comme étant dans le domaine public. Cette erreur a suscité une vive réaction de la part des éditeurs, des auteurs et des défenseurs des droits d’auteur, qui ont souligné que les œuvres de J.K. Rowling restent protégées par le droit d’auteur dans la plupart des pays. L’ensemble de données en question, qui comprenait des extraits des romans Harry Potter, avait été présenté comme une ressource gratuite pour les chercheurs et développeurs souhaitant entraîner des modèles d’intelligence artificielle. Cependant, les textes utilisés étaient en réalité des versions numériques issues de sources non autorisées, souvent téléchargées illégalement sur des sites internet. Microsoft a rapidement reconnu l’erreur, expliquant que le partage avait été « accidentel » et que le contenu n’était pas censé être mis à disposition du public. Dans un communiqué, la société a précisé qu’elle avait retiré le blog et les liens vers l’ensemble de données, tout en s’excusant pour la confusion causée. Elle a ajouté qu’elle renforçerait ses procédures de vérification pour éviter de futures erreurs de ce type. Microsoft a également souligné son engagement à respecter les droits d’auteur et à s’assurer que les données utilisées pour l’entraînement de ses modèles d’IA proviennent de sources licites. Ce scandale survient alors que les questions entourant l’utilisation de contenus protégés pour entraîner les IA sont de plus en plus scrutées. De nombreuses entreprises technologiques sont confrontées à des poursuites ou des critiques pour avoir utilisé des œuvres littéraires, musicales ou visuelles sans autorisation. L’affaire Harry Potter illustre les risques liés à une gestion inadéquate des données, même lorsqu’il s’agit d’un simple oublie dans la classification d’un contenu. La réaction du public a été rapide et sévère, avec des internautes et des associations de défense des auteurs rappelant que l’entraînement d’une IA sur des œuvres protégées sans autorisation peut constituer une violation du droit d’auteur. Certains ont également mis en garde contre les conséquences à long terme, notamment la dilution du mérite créatif et la dévaluation des travaux des auteurs. En fin de compte, cette affaire sert de rappel que même les géants technologiques doivent exercer une vigilance accrue lorsqu’il s’agit de gérer des contenus numériques. L’innovation en matière d’intelligence artificielle ne doit pas se faire au détriment des droits des créateurs.
