ChatGPT 교육 효과 주장한 연구 논문, 1년 만에 철회
학생의 학습 성과와 인지 능력 향상에 ChatGPT가 긍정적 영향을 미친다는 연구 결과가 발표된 지 약 1년 만에 철회됐다. 출판사 스프링거 네이처는 이 논문에 대한 후속 검토 결과, ‘분석상의 불일치’와 ‘결론에 대한 신뢰성 부족’을 이유로 철회했다고 밝혔다.
이 논문은 51건의 선행 연구를 분석해 ChatGPT가 학생의 학습 성과, 학습 인식, 고등 사고 능력에 미치는 영향을 정량화하려 했다. 특히 실험군(ChatGPT 사용 그룹)과 대조군(미사용 그룹)의 효과 크기를 계산했다는 점에서 주목받았다.
‘표준 증거’로 오인돼 확산…소셜미디어에서도 주목
이 연구는 발표 직후 수백 건의 인용과 소셜미디어 상에서의 확산을 기록했다. 일부에서는 이 논문을 ChatGPT와 생성형 AI가 학습에 도움이 된다는 ‘최초의 객관적 증거’로 소개하기도 했다.
에든버러 대학교 디지털 교육 연구 센터의 벤 윌리엄슨 선임강사는 이메일을 통해 “이 논문의 저자들은 ChatGPT가 학습 결과에 미치는 이점에 대한 주목할 만한 주장을 했다”며 “많은 사람들이 이 연구를 생성형 AI가 학습에 도움이 된다는 ‘금과옥조의 표준 증거’로 받아들였다”고 설명했다.
철회 사유: ‘심각한 분석 오류와 신뢰성 문제’
스프링거 네이처는 논문 철회 공지에서 “이 연구는 분석 방법과 데이터 해석에서 심각한 문제점이 발견됐다”며 “결과적으로结论의 신뢰성을 보장할 수 없게 됐다”고 밝혔다. 구체적인 오류는 공개되지 않았지만, 전문가들은 메타분석 방법론상의 오류 가능성이 제기되고 있다.
한편, 이 사건은 AI 기반 교육 도구에 대한 과도한 기대와 오해가 발생할 수 있음을 보여주는 사례이기도 하다. AI 기술이 교육 현장에 도입되면서 관련 연구의 엄밀성과 투명성에 대한 관심이 높아지고 있는 가운데, 이번 철회는 AI 연구의 신뢰성 재고라는 점에서 주목받고 있다.
AI 교육 연구의 신뢰성 재고 필요
전문가들은 이번 사건을 계기로 AI 기반 교육 도구의 효과를 검증하는 연구의 ‘투명성 강화’와 ‘객관적 검증 절차’가 필요하다고 지적한다. 특히 메타분석 연구의 경우, 포함된 개별 연구의 질과 방법론을 엄격히 검토해야 한다는 지적이다.
AI 기술이 교육 분야에 빠르게 확산되면서 관련 연구의 신뢰성은 더욱 중요해졌다. 이번 철회는 AI 교육 연구의 투명성과 엄밀성을 높이기 위한 제도적 장치 마련의 필요성을 부각시키고 있다.