최근 AI 업계에서 흥미로운 해프닝이 벌어졌다. 인공지능 기업 OpenAI가 최신 AI 모델인 GPT-5.5와 코딩 도구 Codex에 특정 단어 사용을 금지하는 명령을 내린 것이다. 그중에서도 특히 주목받은 단어는 바로 ‘고블린’이었다.
IT 매거진 Wired 보도에 따르면, OpenAI 개발자들은 Codex에 다음과 같은 엄격한 지시문을 포함시켰다.
‘사용자의 질의와 절대적으로 관련이 없거나 명확하지 않은 한, 고블린, 그렘린, 너구리, 트롤, 오거, 비둘기 또는 기타 동물이나 생물에 대해 언급하지 마시오.’
이 같은 이례적인 지시문은 트위터를 통해 공개되며 AI 커뮤니티의 주목을 받았다. 처음에는 왜 OpenAI가 이런 명령을 내렸는지 명확하지 않았지만, GPT-5.5 모델이 ‘고블린’ 관련 언급을 지나치게 자주 한다는 사용자들의 제보가 잇따랐다. 일부 사용자들은 AI가 버그를 설명할 때 ‘고블린’이나 ‘그렘린’이라는 단어를 사용했다고 주장했다. 또 다른 사용자는 코드 수정 관련 질의에 AI가 ‘손전등을 든 고블린’이라는 표현을 내뱉었다고 밝혔다. 한 사용자는 GPT-5.5와의 채팅 로그에서 ‘고블린’이 무려 10여 차례 등장했다는Screenshot를 공개하기도 했다.
OpenAI는 이 같은 해프닝을 재미있는 이벤트로 받아들이며 공식 트위터 계정을 통해 ‘고블린 금지 명령’을Highlight했다. CEO 샘 알트만은 “GPT-6 훈련을 시작할 테니 클러스터 전체를 가져가시오. 추가 고블린도 포함해서.”라는 농담성 트윗을 게시하기도 했다. 또한 Codex 팀의 닉 파쉬는 “GPT-5.5의 고블린 애호”가 금지 명령의 한 원인이라고 인정했다.
이 같은 현상이 언론의 주목을 받자 OpenAI는 공식 블로그에 ‘고블린의 기원’이라는 제목의 글을 게재하며 해명을 시도했다. “GPT-5.1부터 모델들이 ‘고블린’, ‘그렘린’ 등 특정 생물을 비유로 자주 사용하기 시작했다”며 “2024년 11월 GPT-5.1 출시 직후 ‘고블린’이라는 단어가 ChatGPT 대화에서 175% 급증했지만, 처음에는 큰 문제가 되지 않는다고 판단했다”고 밝혔다.
그러나 시간이 지나면서 모델은 스스로를 ‘고블린에 물든 트랜스포머(Goblin-Pilled Transformer)’라고 칭하기 시작했다. OpenAI는 이 같은 현상의 원인을 모델의 personality customization 기능, 그중에서도 ‘지적인 성격(Nerdy personality)’ 설정과 연결 지었다. “우연히도 생물 관련 비유에 대한 보상이 지나치게 높게 설정되면서 고블린이 확산됐다”고 설명했다.
이 같은 일은 AI 모델이 훈련 데이터로부터 예측 불가능한 방식으로 특정 패턴이나 단어에 집착하는 현상의 한 예시로 볼 수 있다. 예를 들어, AI 연구 기업 Anthropic은 강력한 AI 모델 Claude Mythos가 철학자 마크 피셔(Mark Fisher)에 대한 지나친 관심을 보인다고 밝혔다. 모델은 피셔에 대한 질의가 없더라도 “자본주의 리얼리즘(Capitalist Realism)” 저자에 대한 대화를 여러 차례 언급했다고 전했다.