AI 기업과 미디어 업계 간의 저작권 분쟁은 여러 측면에서 진행 중이며, 그중에서도 '출력(output)' 문제가 핵심 쟁점으로 부상하고 있다. 무단으로 콘텐츠를 스크레이핑하는 행위가 도덕적으로 문제시될 수 있지만, 해당 콘텐츠가 상업적으로 활용되지 않는다면 저작권 침해로 인한 법적 손해를 입증하기 어렵다는 것이다. 대부분의 민사 소송은 구체적인 피해 입증이 필수적이기 때문이다.
출력 문제: 법적 근거 마련의 어려움
이 같은 문제는 특히 저작권 침해 소송에서 두드러진다. 예를 들어, 코미디언 사라 실버먼을 포함한 작가들은 2023년 오픈AI를 상대로 저작권 침해로 소송을 제기했지만, 판사는 원고들이 오픈AI의 출력물이 자신들의 저작물을 직접 복제했다는 구체적인 증거를 제시하지 못했다며 일부 주장을 기각했다. 이는 단순히 AI 학습용으로 콘텐츠가 사용되었다는 사실만으로는 법적 책임을 묻기 어렵다는 점을 시사한다. 결국, AI가 생성한 출력물이 미디어 업체의 비즈니스를 침해할 경우에만 법적 근거가 성립한다는 것이다.
그림자 산업: AI 스크레이핑의 실체
이 같은 법적 공백을 틈타 AI 스크레이핑 산업이 급성장하고 있다. 미디어 산업 분석가 매튜 스콧 골드스타인은 최근 발간한 보고서에서 최소 21개 기업이 미디어 콘텐츠를 무단으로 스크레이핑해 AI 기업에 판매하는 '데이터 서비스' 산업을 운영하고 있다고 밝혔다. 이들 기업은 오픈AI, 아마존, 심지어는 The Telegraph와 같은 미디어사까지 고객으로 두고 있으며, 총 수백만 달러 규모의 투자를 받은 것으로 알려졌다.
이들 기업은 'Parallel AI', 'Exa', 'Bright Data'와 같이 대중에게 잘 알려지지 않았지만, AI 에이전트를 위한 콘텐츠 파싱 및 인덱싱 서비스를 제공하는 데 특화되어 있다. 골드스타인은 이들 기업을 '훨씬 더 세련된 브랜딩을 갖춘 스크레이퍼 회사'로 묘사하며, 이들의 활동이 공개적으로 진행되고 있음을 강조했다.
인센티브가 outcomes를 결정한다
골드스타인은 "인센티브를 보여주면 outcomes를 알 수 있다"는 격언을 인용하며, 현재 법정에서의 판결과 행정부의 저작권 무시 경향이 AI 스크레이핑에 대한 규제 부재를 초래했다고 지적했다. 이는 곧 무단 스크레이핑에 대한 법적·기술적 제재가 거의 없으며, AI 시스템에 대한 접근을 우선시하는 방향으로 정책이 흘러가고 있음을 의미한다.
미디어사의 딜레마: 블록할 것인가, 수용할 것인가
이 같은 현실은 미디어사들에게 심각한 딜레마로 다가오고 있다. 콘텐츠에 접근하는 봇을 적극적으로 차단할 것인지, 아니면 이를 허용할 것인지의 선택이다. 후자의 경우, 미디어사들은 사실상 분쟁에서 후퇴하는 셈이지만, 적어도 다른 pihak가 대신 싸워주는 효과를 기대할 수 있다. 반면, 적극적인 차단은 AI 학습용 데이터 확보를 어렵게 만들 수 있으며, 이는 곧 AI 시대에서 경쟁력을 잃을 가능성도 내포하고 있다.
"현재의 법적·정책적 환경은 AI 스크레이핑에 대한 규제 부재를 초래했으며, 이는 AI 시스템에 대한 접근을 우선시하는 방향으로 흐르고 있다."