AIとメディアの法廷闘争:立証の壁「出力」の問題
AI企業とメディア業界の著作権を巡る法廷闘争は、さまざまな側面で激化している。その中でも最大の争点が「出力」の問題だ。無断でコンテンツを収集する行為は非難されるべきだが、その収集されたデータが「コンテンツクリエイターの競争相手にならない」場合、法的な損害の立証が極めて困難となる。多くの民事訴訟では、被害の立証が敗訴の鍵を握るが、無断収集だけでは立証が難しいのが現実だ。
この問題を象徴するのが、2023年に起きた作家グループによるOpenAIへの訴訟だ。コメディアンのサラ・シルバーマンを含む作家たちは、自身の著作を無断でAIの学習に使用されたとしてOpenAIを提訴したが、裁判所は「具体的な複製物が示されていない」として複数の請求を棄却した。単に「自分の著作がAIの学習に使われた」と主張するだけでは不十分で、そのAIが「自らのビジネスを奪う出力を生成している」ことを示す必要があるのだ。
「出力」の実態:闇に包まれたAI収集ビジネス
著作権侵害の訴訟では、無断収集と複製の具体的な事例を示すことが求められる。しかし、その多くはボットによる大規模かつ迅速、そして目立たない形で行われている。公開されているChatGPTやGemini、Perplexityの出力とは異なり、その裏側では「闇の産業」が拡大しているのだ。
メディアアナリストのマシュー・スコット・ゴールドスタイン氏は、第三者ブローカーを通じたAI企業の無断収集の実態を詳細に報告した。同氏の調査によると、少なくとも21社が数億ドル規模の資金調達を受け、出版社のコンテンツを無断で収集し、それを「データサービス」として販売しているという。顧客にはOpenAIやAmazon、さらには「ザ・テレグラフ」のような他の出版社も含まれる。
この報告書が明らかにしたのは、無断収集が「出力」としてどのような形で行われているかだ。具体的には、インターネット上のデータを解析し、ボットやエージェント向けに整理されたコンテンツを提供する「マルチミリオンダラー企業」が存在する。これらの企業はParallel AI、Exa、Bright Dataといった名称で知られるが、その実態は「より洗練されたブランドを持つスクレイパー企業」に過ぎない。
法的整備の遅れとメディアのジレンマ
ゴールドスタイン氏は、これらの企業が自らの行為を隠そうとしない点を指摘する。例えば、ウォールストリート・ジャーナルの記事でParallel AIは「AIエージェント向けのプラットフォーム」と紹介されたが、同氏はこれを「より洗練された表現のスクレイパー企業」と表現する。このような状況下で、法廷は無断収集に対する厳しい判断を下すことが難しくなっている。
さらに、現在の米国政府が著作権への懸念を軽視していることも、無断収集の横行に拍車をかけている。裁判所の敗訴が相次ぐ中、法的・技術的な規制はAIシステムへのアクセスを優先する方向に傾いている。その結果、メディア企業は深刻なジレンマに直面している。
メディア企業の選択:ボットを排除するか、それとも受け入れるか
この現実に直面したメディア企業は、二つの選択肢に迫られている。一つは、ボットによる無断収集を徹底的に排除すること。もう一つは、それを受け入れることで、少なくとも他者との競争を回避することだ。
しかし、後者の選択は事実上の敗北を意味する。その一方で、ボットを排除すれば、検索エンジンやソーシャルメディアからのトラフィックが減少し、ビジネスへの悪影響が懸念される。メディア企業にとって、このジレンマは単なる法的問題にとどまらず、ビジネスモデルそのものの存続に関わる重大な課題となっている。
「インセンティブを示せば、その結果が見えてくる」。無断収集が横行する背景には、法的な責任がほとんど問われない現状がある。その結果、AI企業はますます大胆な行動を取るようになり、メディア業界はその影響を受け続けることになる。