HyperAIHyperAI

Command Palette

Search for a command to run...

GitHub CopilotとAIモデルのGPL伝播論:2025年現在の法的・技術的状況

2025年現在、GPL(GNU General Public License)のコードを学習データに用いたAIモデルに対して、そのライセンスが「伝播」するという理論は、2021年のGitHub Copilot発表当時ほど注目されていない。しかし、完全に否定されたわけではなく、法的・技術的・政策的な観点から議論は続いており、未解決の課題として残っている。 この理論の核心は、「AIモデルがGPLコードを学習した場合、そのモデル自体がGPLの派生著作物と見なされ、モデルの公開にあたってGPLの条件(例:ソースコードの開示)が適用される」というものだ。2022年に始まった米国での「Doe v. GitHub(Copilot集団訴訟)」では、GPLやMITなど、著作権の表示や派生作品の開示義務を守らなかったとして、AIの学習・出力がライセンス違反と主張されている。この訴訟では、DMCA違反や不正利得などの主張は退けられたが、「オープンソースライセンスの契約違反」は存続しており、モデルの提供がライセンス条件を無視する行為として、差し止め請求の余地が残っている。 一方、ドイツのGEMAがOpenAIを相手に提起した訴訟では、ChatGPTが歌詞を記憶し、ユーザーの簡単なプロンプトでほぼ原文を再現する事例が問題視された。ミュンヘン地裁は、モデル内のパラメータに作品が「記録」されている状態が、ドイツ著作権法上の「複製」に該当すると判断。モデルが特定の作品を高頻度で再現する場合、それは「分析の範囲を超えた複製」として著作権侵害とされた。この判決は、AIモデルが学習データの「複製」を内包する可能性を法的に認めた画期的なものであり、GPLの伝播理論を支える土台を提供している。 しかし、この理論を支持する法的根拠は依然弱い。日本では2018年改正の著作権法第30条の4により、AI学習に際してのデータ収集・複製は、情報分析の目的であれば合法とされる。文部科学省の「AIと著作権に関する考察」では、モデル自体は「一般的に特定作品の複製とは言えない」とし、出力が元の作品と類似する場合に限り、侵害として扱う可能性があると明言。また、GPLの文言は「派生作品」や「プログラムを含む作品」に限定されており、AIモデルの重みや統計的特徴は「ソースコードの好ましい形」には該当しない。さらに、100万件のライセンスが混在する学習データから1つのモデルに「すべてのライセンスが伝播」するという現実的非現実性も指摘される。 OSI(オープンソース・イニシアティブ)は2024年の「Open Source AI Definition」で、モデルの重みや学習データの性質の開示を要件としつつ、全データの開示を義務付けていない。FSF(フリーソフトウェア財団)も、AIの自由を実現するための新規枠組みの検討を進めており、現行GPLの拡張は現実的ではないと明言している。 結論として、GPLの伝播理論は法的・技術的に大きなハードルがあり、現時点では実現可能性は極めて低い。しかし、訴訟の進展や国際的な法的スタンスの変化によって、再び議論が活性化する可能性は残っている。現在の主流は、「技術的透明性の確保」「データの洗浄」「ライセンス付与の自動化」などの実践的対策を進める姿勢であり、自由の精神をAI時代にどう継承するかが、今後の鍵となる。

関連リンク