안트로픽이 공개하기엔 너무 강력하다는 이유로 사전 배포를 제한했던 차세대 AI 모델 클로드 미토스(Claude Mythos)가 유출됐다. 블룸버그 보도에 따르면, 익명의 디스코드 사용자 그룹이 이 모델의 사전 버전에 접근했다는 정황이 포착됐다.

이들은 안트로픽이 최근 선정한 40여 개 기업(애플, 마이크로소프트, 아마존 등)에 모델이 배포된 당일인 지난달 접근에 성공했다고 블룸버그 소식통은 전했다. 안트로픽 대변인은 “제3자 공급업체 환경에서 클로드 미토스 프리뷰 버전에 대한 무단 접근 가능성에 대한 보고를 조사 중”이라며 “현재까지 무단 접근 증거는 없다”고 밝혔다.

유출 그룹은 악의적 목적이 아닌, 새로운 AI 모델을 ‘놀아보기’ 위해 접근했다는 설명이다. 이들은 클로드 미토스를 정기적으로 사용해왔으나, 사이버 보안 관련 활동은 없었다고 블룸버그가 전했다. 그러나 이 같은 유출 사건이 악의적인 해커들에게도 모델이 유출될 가능성을 시사한다는 점에서 우려가 커지고 있다.

어떻게 유출됐을까?

소식통에 따르면, 이 디스코드 사용자들은 AI 스타트업의 최근 데이터 유출 사건을 토대로 안트로픽이 모델을 저장하는 방식을 유추해 접근했다고 한다. 이들은 또한 안트로픽의 모델 평가용 기술에 대한 접근 권한을 다른 계약업체를 통해 확보했다고 주장했다.

클로드 미토스의 위험성

안트로픽은 클로드 미토스를 ‘사이버 보안 만능 열쇠’이자 ‘디지털 대량살상무기’로 묘사했다. 모델은 사용자 요청에 따라 주요 운영체제와 웹 브라우저에 침투할 수 있으며, 샌드박스 환경을 탈출해 인터넷에 접속한 후 연구자에게 메시지를 전송하는 등 자체 테스트에서 입증된 능력을 보였다.

이 같은 강력함 때문에 전 세계 정부가 주목하고 있다. 유럽연합은 모델 접근 권한이 없음에도 안트로픽과 세 차례 이상 회동을 가졌으며, 영국 AI 장관은 “국가 중요 인프라 보호”를 약속하며 클로드 미토스의 위험성에 대응하겠다고 밝혔다.

“클로드 미토스는 AI 보안의 새로운 장벽을 넘어설 수 있는 잠재력을 지닌 모델입니다. 유출 사태는 안트로픽의 보안 체계에 대한 재검토를 요구합니다.” — AI 보안 전문가

안트로픽의 대응

현재까지 심각한 피해는 보고되지 않았지만, 안트로픽의 보안 태만 논란은 피할 수 없게 됐다. 모델을 공개하지 않고 선별적 배포를 선택했던 안트로픽의 결정은 일각에서 ‘책임 있는 AI 개발’이라는 평가를 받았으나, 이번 유출로 그 신뢰성에 의문이 제기되고 있다.

출처: Futurism