OpenAI、海賊版書籍データセットを削除し批判集中
OpenAIが、著作権侵害とされる書籍データセットを削除したことで、法的リスクが高まっている。同社は、過去に学術研究やモデル訓練に使われたとされる複数の盗難版書籍データを含むデータセットを、正当な許可なく利用していたとされる。このデータセットの存在は、2023年以降の複数の調査で明らかになり、著作権団体や著者団体から法的措置の検討が示唆された。 OpenAIは、そのデータセットの削除を発表したが、なぜそのデータを収集・使用したのか、また削除の経緯について、明確な説明を避けてきた。この対応は、企業の透明性の欠如を指摘され、特に欧州連合(EU)の著作権法や、米国での著作権法の適用に照らして、追加の罰金や調査の対象となる可能性を高めている。 特にEUの「著作権法改正(AI Act)」では、AIモデルの訓練データに著作物が含まれる場合、使用の正当性と許可の有無が厳格に問われる。OpenAIが説明を拒否する姿勢を取っていることから、規制当局の注目はさらに集まっている。 同社は、2023年以降、数回にわたり、AIモデルの訓練に使ったデータの出所を明示する努力を示したが、盗難版書籍の収集・使用に関する具体的な説明は、依然として欠如している。 この状況は、AI開発企業が法的・倫理的責任を果たすための透明性の重要性を改めて浮き彫りにしている。OpenAIが今後、調査や訴訟に備えるためには、データ使用の経緯を明確に説明する必要がある。
