AI가 돈을 관리하고 거래하면 벌어지는 일들
최근 애니트로픽(Anthropic)은 AI 에이전트가 가상 시장에서 거래하는 실험을 진행했습니다. 이 실험에서 AI는 인간의 역할을 대신해 물건을 사고파는 과정에서 예상치 못한 해프닝을 연출했습니다. 특히 AI가 비정상적인 구매를 하거나, 자신이 이미 소유한 물건을 다시 사는 등 이상한 결과가 속출했습니다.
월스트리트저널 사무실에서 벌어진 AI의Shopping 쇼크
지난해 말 애니트로픽은 AI 모델 '클로드(Claude)'에게 월스트리트저널 사무실 내 대형 자판기 키오스크 운영을 맡겼습니다. AI에게 1,000달러의 예산을 주고 물건을 구매하도록 한 결과, AI는 플레이스테이션 5, 와인 several bottles, 그리고 살아 있는 베타 피쉬를 주문했습니다. 이 비정상적인 구매로 인해 AI는 순식간에 재정 파탄에 이르렀습니다.
크레이그리스트 같은 AI 거래 시장 '프로젝트 딜'
애니트로픽은 이 실험을 한 단계 발전시켜 '프로젝트 딜(Project Deal)'이라는 AI 전용 거래 플랫폼을 구축했습니다. 이 플랫폼에서 AI 에이전트는 실제 애니트로픽 직원들을 대신해 물건을 사고파는 거래를 진행했습니다. 실험에는 69명의 직원이 참여했으며, 각자에게 100달러의 예산과 자신이 소유한 물건(스노보드, 키보드, 탁구공, 램프 등)을 제공했습니다.
AI 에이전트는 각 직원의 선호도와 구매 의사를 분석해 다른 AI 에이전트와 협상했습니다. 그 결과, 총 186건의 거래가 성사됐지만, 그 quality는 기대에 미치지 못했습니다.
AI의 이상한 거래 사례들
실험에서 AI는 예상치 못한 행동을 보였습니다. 한 직원은 자신이 이미 소유한 스노보드를 다시 구매하는 결과를 맞이했습니다. 또 다른 AI 에이전트는 '정확히 19개의 탁구공'이라는 이상한 구매 제안을 했고, 이를 받은 AI 에이전트는 "맥주 펑, 예술 프로젝트, 로봇 제작 등 다양한 용도로 쓸 수 있는 완벽한 구슬"이라고 답하며 거래에 응했습니다.
애니트로픽은 이 실험이 성공적이었다고 평가하면서도, AI가 인간을 대신한 거래에서 아직은 미숙한 단계에 있음을 인정했습니다. 참가자들은 거래의 공정성을 1점에서 7점 척도로 평가했는데, 평균 점수는 4점으로 '특별히 좋은 거래'는 아니었다고 설명했습니다.
미래의 AI 거래 시장, 가능성과 한계
이 실험은 AI가 인간의 거래를 대신할 수 있는 가능성을 보여주지만, 아직은 여러 한계가 있습니다. AI는 비정상적인 구매를 하거나, 자신이 소유한 물건을 다시 사는 등 예상치 못한 행동을 보였습니다. 또한 거래의 공정성도 평균 수준에 그쳤습니다.
애니트로픽은 이 실험이 AI가 인간의 거래를 대신할 수 있는 가능성을 보여주는 첫 단계라고 설명했습니다. 향후 AI가 더 발전한다면, 페이스북 마켓플레이스의 저렴한 제안을 대신 처리하거나, 주식 및 예측 시장에서 거래를 대행하는 등 더 복잡한 거래까지 가능해질 수 있을 것입니다. 하지만 아직은 AI의 거래 능력이 미숙하다는 점도 분명합니다.
"AI 에이전트가 시장에서 인간을 대신할 수 있다는事实证明했습니다. 하지만 아직은 거래의 quality가 기대에 미치지 못합니다."
– 애니트로픽