Meta visée pour violation de droits d'auteur
Selon le New York Times, cinq éditeurs – Macmillan, McGraw Hill, Elsevier, Hachette et Cengage –, ainsi que l'écrivain Scott Turow, ont intenté une action en justice conjointe contre Meta pour « avoir commis l'une des violations les plus graves du droit d'auteur de l'histoire ». L'acte d'accusation accuse Meta d'avoir reproduit à plusieurs reprises sans autorisation les livres et revues de ces institutions, tout en s'étant délibérément procuré du contenu auprès de sites de piratage tels que LibGen, Anna's Archive et Sci-Hub afin de l'utiliser dans l'entraînement du modèle Llama. Le jeu de données Common Crawl serait également saturé d'un grand nombre d'œuvres protégées par le droit d'auteur non autorisées. L'acte d'accusation cite un exemple où, après avoir saisi deux courts extraits du manuel Calculus : Early Transcendentals publié par Cengage dans Llama, le modèle a répété mot à mot la suite du texte original. Des auteurs avaient déjà poursuivi Meta, révélant que l'entreprise avait discuté en interne de la manière de répondre aux interrogations médiatiques concernant l'utilisation de jeux de données connus comme étant illégaux. Bien qu'un juge fédéral ait statué en faveur de Meta l'an dernier, il a clairement indiqué que cette décision ne signifiait pas que l'utilisation de contenus sous droits d'auteur pour entraîner des modèles d'intelligence artificielle était légale. Par ailleurs, Anthropic avait précédemment accepté de verser 1,5 milliard de dollars pour régler des questions similaires relatives au respect du droit d'auteur. Dave Arnold, porte-parole de Meta, a déclaré : « La Cour a établi que l'entraînement des IA peut constituer un usage loyal ; nous allons donc plaider avec vigueur notre cause. »
