HyperAIHyperAI

Command Palette

Search for a command to run...

Adobe poursuivie pour utilisation non autorisée d’œuvres d’auteurs dans l’entraînement de son modèle AI

Adobe fait face à une action en justice collective proposée, accusée d’avoir utilisé illégalement les œuvres d’auteurs pour entraîner ses modèles d’intelligence artificielle. Comme la plupart des géants de la technologie, la société a fortement investi dans l’IA ces dernières années, lançant plusieurs services, dont Firefly, sa suite d’outils de génération de médias alimentés par l’intelligence artificielle. Mais cette montée en puissance pourrait désormais lui valoir des ennuis juridiques. Une action en justice collective, déposée au nom d’Elizabeth Lyon, auteure originaire de l’Oregon, accuse Adobe d’avoir utilisé des versions piratées de nombreux livres — y compris ses propres ouvrages — pour entraîner son modèle SlimLM. Ce dernier, présenté comme une série de petits modèles linguistiques optimisés pour des tâches d’aide documentaire sur appareils mobiles, aurait été pré-entraîné sur un ensemble de données open source appelé SlimPajama-627B, publié en juin 2023 par Cerebras. Selon le recours, SlimPajama a été construit en copiant et en manipulant le dataset RedPajama, qui inclut à son tour une vaste collection de 191 000 livres connue sous le nom de Books3. C’est cette dernière, largement utilisée pour entraîner des modèles d’intelligence artificielle, qui est au cœur des préoccupations juridiques. Le texte de l’action affirme que « puisque SlimPajama est une copie dérivée de RedPajama, il contient le jeu de données Books3, y compris les œuvres protégées par le droit d’auteur de la plaignante et des membres de la classe ». Ce type de litige n’est plus une exception. En septembre, une plainte contre Apple avait déjà accusé la société d’avoir utilisé des œuvres protégées pour entraîner son modèle Apple Intelligence, sans autorisation ni rémunération. En octobre, une autre action similaire avait été déposée contre Salesforce, qui aurait également utilisé RedPajama dans ses processus d’entraînement. Ces affaires illustrent une tendance croissante : les grandes entreprises technologiques sont de plus en plus confrontées à des poursuites pour utilisation non autorisée de contenus protégés dans leurs jeux de données d’entraînement. Le cas d’Anthropic, qui a accepté en septembre de verser 1,5 milliard de dollars à une série d’auteurs poursuivant la société pour usage de versions piratées de leurs œuvres dans le développement de son chatbot Claude, a été vu comme un tournant dans ces conflits juridiques. Il souligne la montée en puissance des revendications des créateurs face à l’exploitation massive de leurs œuvres pour entraîner des systèmes d’IA, souvent sans leur consentement, ni compensation. Les enjeux sont désormais clairs : si l’IA progresse rapidement, les questions liées à la propriété intellectuelle, à la transparence des données d’entraînement et à la reconnaissance des auteurs restent au cœur des débats. Pour Adobe comme pour d’autres géants, cette affaire pourrait marquer un tournant dans la manière dont les entreprises justifient leur utilisation des contenus créatifs dans leurs modèles d’intelligence artificielle.

Liens associés

Adobe poursuivie pour utilisation non autorisée d’œuvres d’auteurs dans l’entraînement de son modèle AI | Articles tendance | HyperAI