뉴욕 연방법원에 제출된 소장에 따르면, 메타와 마크 저커버그는 AI 시스템 훈련을 위해 수백만 권의 저작권 보호 책, 기사, 기타 저작물을 무단으로 복제했다는 혐의를 받고 있다. 출판사 Hachette, Macmillan, McGraw Hill, Elsevier, Cengage와 작가 Scott Turow는 이 같은 주장과 함께 메타를 상대로 집단 소송을 제기했다.
소장은 "메타와 저커버그는 AI '군비경쟁'에서 우위를 점하기 위해 '빨리 움직이고, 문제를 일으켜라'라는 모토를 실천했다"며 "유명 해적 사이트에서 수백만 권의 저작권 보호 책과 학술지를 불법으로 다운로드하고, 인터넷 전체 웹 스크래핑 자료를 무단으로 복제했다"고 밝혔다. 이어 "이들은 훔친 자료를 반복해 복제해 메타의 AI 모델 'Llama' 훈련에 사용했으며, 역사상 유례없는 대규모 저작권 침해를 저질렀다"고 주장했다.
저작권 관리 정보 삭제, 무단 사용 은폐 시도
소장에 따르면, 메타는 저커버그의 지시 하에 출판사들이 소유하거나 관리하는 저작물을 무단 복제했을 뿐만 아니라, 추가로 복제해 Llama 훈련에 사용했다고 한다. 특히, 메타는 저작권 관리 정보를 삭제해 훈련 자료 출처를 숨기고 무단 사용을 용이하게 했다는 혐의도 받고 있다.
AI 훈련 방식 전환 논의도 무산
메타는 Llama 1 출시 후 잠시 출판사들과의 라이선스 계약을 확대할지 고민했지만, 결국 저커버그의 결정으로 무산됐다. 소장에 따르면, 메타는 라이선스 예산을 2억 달러까지 늘릴 계획이었으나, 저커버그가 "앞으로도 라이선스를 체결할 것인가, 아니면 불법 복제를 지속할 것인가"라는 질문에 대해 라이선스 중단 명령을 내렸다고 한다. 한 메타 직원은 "단 한 권의 책이라도 라이선스를 체결하면 '공정이용' 전략을 펼치기 어렵다"고 설명했다고 소장은 전했다.
AI가 인간의 창작물을 대체할 수준으로 발전
소장은 Llama가 훈련 자료를 바탕으로 특정 작가의 표현 방식과 창작 스타일을 모방할 수 있으며, 사용자들은 AI가 책을 쉽게 생성할 수 있다고 지적했다. 특히 "Llama는 AI 생성 콘텐츠로 시장을 flooded하고 있으며, 그 속도와 규모는 전례가 없다"며 "이는 메타가 저작권 보호 자료를 무단으로 복제했기 때문에 가능한 것"이라고 주장했다.
"사용자들은 AI가 책을 쉽게 생성할 수 있는 능력을 자랑하지만, 이는 메타가 저작권 보호 자료를 무단으로 복제했기 때문에 가능한 일이다."
한편, 메타 대변인은 "유사한 소송들이 법정에서 기각된 전례가 있다"며 "AI는 개인과 기업의 혁신과 생산성을 높이는 데 기여하고 있으며, 저작권 보호 자료를 AI 훈련에 사용하는 것이 공정이용에 해당할 수 있다는 판결이 이미 내려졌다"고 반박했다.