AI 생성 콘텐츠, 더 이상 늘어나지 않는 이유

2022년 11월 ChatGPT가 공개된 이후 AI가 생성한 글들이 인터넷을 점령할 것이라는 우려가 컸다. 그러나 최근 분석 결과, AI가 쓴 글의 비중이 더 이상 늘어나지 않고 정체기에 접어들었다는 사실이 확인됐다. 디지털 마케팅 에이전시 그래파이트(Graphite)의 분석에 따르면, AI가 주로 작성한 기사·블로그·리스트icle의 비중은 1년 넘게 약 50% 수준을 유지하고 있다.

“AI가 인터넷을 장악하지 못한 이유”

AI 생성 콘텐츠의 확산 속도가 둔화된 이유는 무엇일까? UC 버클리 교수이자 AI 모델 CTO인 댄 클라인은 “이 모델들은 우리가 웹에 올린 정보 덕분에 똑똑해진다”며 “만약 AI 모델에 의존하지 않는 새로운 지식이 더 이상 창조되지 않는다면, 모델을 발전시킬 데이터가 사라질 것”이라고 경고했다.

수치로 본 AI 생성 콘텐츠의 변화

  • ChatGPT 출시 1년 후(2023년): AI가 주로 작성한 콘텐츠 비중 35.9%
  • 2년 후(2024년): 48%로 급증
  • 2025년 초 이후: 약 50%에서 정체

연구 방법론: 어떻게 AI 생성 여부를 판단했나?

그래파이트는 웹 아카이브 ‘Common Crawl’에서 5만 5,400개의 영어 웹페이지를 무작위로 추출해 분석했다. 분석 대상은 2020년 1월~2026년 3월 사이에 게시된 100자 이상의 기사와 리스트icle로, 판그램(Pangram), GPTZero, 코피리크스(Copyleaks) 등 3개 AI 탐지 도구를 통해 AI 생성 여부를 판별했다.

AI와 인간의 경계가 모호해지는 현실

AI 생성 콘텐츠를 판단하는 일은 여전히 복잡하다. 많은 글들이 순수 인간 또는 AI에 의해 쓰이지 않기 때문이다. 예를 들어, 인간이 기획·초안 작성·수정 등에 AI를 활용하면 ‘AI가 쓴 글’과 ‘인간이 쓴 글’의 경계가 흐려진다. 그래파이트는 글의 대부분이 AI 탐지 도구에 의해 AI 생성으로 분류될 때만 ‘주로 AI가 쓴 글’로 분류했다.

“AI 콘텐츠의 질은 빠르게 향상되고 있다. 많은 경우, AI가 쓴 글은 인간보다 더 좋거나 비슷할 정도로 수준이 높다. 사람들은 AI가 쓴 글과 인간 글의 구분을 점점 어려워하고 있다.” (그래파이트 분석 결과 中)

앞으로의 과제: AI 피드백 루프의 위험성

전문가들은 AI가 생성한 콘텐츠가 다시 AI 학습 데이터로 사용되면서 ‘자기 먹기(self-eating)’ 현상이 발생할 수 있다고 우려한다. 클라인은 “AI 모델은 우리가 만든 정보로 학습한다. 만약 AI에 의존하지 않는 새로운 지식이 사라진다면, 모델은 더 이상 발전할 수 없을 것”이라고 지적했다.

결론: AI가 쓴 글, 인간과 대등해졌지만 한계도 뚜렷

현재 AI는 인간만큼 많은 글을 쓰고 있지만, 더 이상 그 비중이 늘어나지는 않고 있다. AI 생성 콘텐츠의 질적 향상은 긍정적이지만, 무분별한 확산은 인터넷의 정보 질을 떨어뜨릴 수 있다는 점에서 신중한 접근이 요구된다.

출처: Axios