学習データと著作権とは
学習データと著作権とは、AIモデルの訓練に使用されるデータに含まれる著作物の利用許諾に関する法的問題です。大規模言語モデルや画像生成AIはインターネット上の膨大なテキスト・画像を学習データとして使用しており、著作権者の許諾なく行われることの是非が世界的に議論されています。
日本の法的枠組み
日本の著作権法第30条の4は、情報解析のための著作物の利用を広く認めており、AI学習のためのデータ利用は原則として著作権侵害にはあたりません。ただし、「著作権者の利益を不当に害する場合」には適用されないとされており、その具体的な範囲は議論が続いています。
訴訟と紛争
米国では、ニューヨーク・タイムズがOpenAIとMicrosoftを著作権侵害で提訴するなど、AI学習データをめぐる訴訟が相次いでいます。画像分野でもStability AIやMidjourneyに対するアーティストからの集団訴訟が提起されています。
ライセンスとデータ取引
法的リスクを回避するため、AI開発企業と出版社やコンテンツ企業との間でデータライセンス契約を結ぶ動きが広がっています。適法なデータ調達の仕組みやデータマーケットプレイスの整備が今後の重要な課題です。