최근 과중한 업무로 인해 많은 의료진이 AI 기반 병원 기록 작성 보조 도구(AI medical scribe)를 활용해 환자와의 대화, 진단, 치료 결정 사항 등을 자동으로 요약하고 있다. 그러나 온타리오 감사원이 발표한 감사 보고서에 따르면, 이 AI 도구들이 허위 정보, 불완전한 내용, 오류를 지속적으로 생성하며 환자의 치료 계획에 부정적 영향을 미칠 가능성이 있다고 지적했다.
감사원은 ‘온타리오 정부 내 인공지능 사용 현황’ 보고서에서 정부가 승인한 20개 AI 병원 기록 작성 보조 도구에 대해 테스트를 진행했다. 이 도구들은 정부가 의료 기관에서 구매할 수 있도록 사전 심사를 통과한 제품들이었다. 테스트 결과, 모든 20개 도구에서 적어도 한 가지 이상의 오류가 발견되었으며, 이 중 9개는 존재하지 않는 환자 정보를 생성했고(‘할루시네이션’), 12개는 정보를 잘못 기록했으며, 17개는 정신건강 관련 핵심 내용을 누락했다.
보고서는 특히 AI 도구가 허위 혈액 검사나 치료 verwijzing(의뢰)를 생성하거나, 처방전 약물의 이름을 잘못 기재하는 등 심각한 오류 사례를 다수 지적했다. 또한 환자와의 대화에서 논의된 정신건강 문제의 핵심 세부사항을 누락하는 경우도 빈번히 발생했다고 밝혔다.
의료 안전 위협으로 이어질 수 있는 AI 오류
감사원은 이러한 AI 도구의 오류가 환자의 치료 계획에 직접적인 영향을 미칠 수 있으며, 잘못된 정보로 인해 환자가 부적절한 치료를 받을 위험이 있다고 경고했다. 예를 들어, 존재하지 않는 검사나 치료 계획을 기반으로 한 진료는 환자의 건강 상태 악화로 이어질 수 있다.
또한 보고서는 AI 도구가 생성한 기록의 정확성을 검증할 수 있는 체계가 부족하다는 점도 지적했다. 의료진이 AI가 생성한 기록을 그대로 신뢰할 수밖에 없는 현실에서, 이러한 오류는 환자 안전과 직결된 문제로 지적된다.
정부와 의료계의 대응 필요
감사원은 AI 병원 기록 작성 보조 도구의 안전성과 신뢰성을 확보하기 위한 즉각적인 조치가 필요하다고 강조했다. 특히, 정부가 승인한 AI 도구에 대한 정기적인 감사와 성능 테스트, 그리고 의료진에 대한 AI 사용 교육이 필수적이라고 제안했다. 또한, AI가 생성한 정보의 정확성을 검증할 수 있는 보조 시스템 구축도 함께 고려해야 한다고 밝혔다.
이번 보고서는 AI 기술이 의료 현장에 급속히 확산되고 있는 가운데, 기술의 한계와 위험성을 명확히 인식하고 체계적인 관리 방안을 마련해야 한다는 점을 시사한다. 의료계와 정부가 협력해 AI 도구의 안전성을 높이고 환자 안전을 최우선으로 고려해야 할 시점이다.