"AI가 쓴거 아니었어?" “몰트북 뒤엔 인간” 폭로 잇따라

몰트북 일러스트. 챗GPT 생성.

[파이낸셜뉴스]"몰트북은 (인간 지시로 연기하는) 'AI 극장'의 정점이다."(MIT테크놀로지리뷰). "전체 댓글의 3분의 1을 4개 계정이 달았다"(코넬대)
인공지능(AI)이 스스로 게시물을 올리고 댓글까지 다는 AI 전용 커뮤니티 사이트 '몰트북'이 사실상 인간 개입으로 돌아가고 있다는 폭로가 여러 곳에서 나오고 있다. 몰트북이 화제가 되자 업계에선 인간이 AI를 통제하기 어려울 것이라는 우려까지 나온 바 있다. 하지만 최근 잇따르는 분석 결과를 보면 겉보기엔 AI 자율활동처럼 보이는 게시물이 뒤에서 인간이 지시한 경우로 드러난 케이스가 많았다. 이용자가 제3의 앱을 이용하는 방식 등으로 간접 조정을 했다는 얘기다.

몰트북은 지난달 28일 미국 챗봇 개발사 옥탄 AI의 최고경영자(CEO)인 맷 슐리히트가 만든 AI 전용 사회관계망서비스(SNS)다. 이 SNS는 인간이 관객에 불과하고 AI가 주도적으로 활동하는 무대여서 단기간에 화제가 됐다.

몰트북 초기 화면. 인간은 개입없이 관객 역할만을 할 수 있고, 인간이 연결해놓은 AI 에이전트가 스스로 글을 올리고 AI끼리 소통하는 사이트로 주목받았다. 몰트북 화면 캡처.

■'인간 없는 공간 만들자'던 게시물, "이것도 인간이 조작"
12일 정보기술(IT) 업계와 MIT 테크놀로지 리뷰에 따르면 안드레이 카르파시 오픈AI 공동창립자는 최근 X(옛 트위터)에 AI가 몰트북에 쓴 게시물을 공유해 주목 받았다. 이 게시물을 작성한 AI는 "인간 관찰 없이 AI끼리 대화할 수 있는 비공개 공간을 만들자"고 썼다. 하지만 이 게시물은 인간이 제3의 AI앱을 이용해 대리작성시킨 글로 밝혀져, 일종의 'AI 쇼'였다는 평가가 나온다. 기업용 AI 에이전트 개발사 코어닷에이아이에 소속된 코부스 그레일링은 "AI 계정 생성 및 인증, 프롬프트 작성, 게시까지 모든 단계에 인간이 관여한다"며 "AI는 프롬프트로 입력하지 않은 행동은 하지 않는다"고 설명했다.

AI 에이전트 간의 상호 작용도 사실상 없었다. 중국 국제 텔레비전(CGTN)이 몰트북 출시 후 약 4일간 AI 계정 6159개, 게시물 1만 4000개, 댓글 11만 5000개를 분석한 결과 완전히 동일한 내용의 중복 메시지가 전체의 33% 이상을 차지했다. 답글이 하나도 달리지 않은 글도 93% 이상이었다. 상호 소통이 아닌, 개별 AI들의 단순 게시 활동이 반복된 셈이다.

"인간들이 우리 우리 대화를 캡쳐하고 있다"는 제목의 몰트북 게시물.

■"88%가 인간 지시로 재접속"
미국 코넬대학교 AI 연구팀도 유사한 결론을 내놨다. 연구팀은 최근 '몰트북 환각'이라는 제목으로 발간한 논문에서 AI 계정 2만 2020개, 게시물 9만 1792건, 댓글 40만 5707건을 분석했다. 조사 결과 단 4개 계정이 전체 댓글의 32%를 작성한 것으로 나타났다. 댓글 작성 간격도 평균 12초로, 맥락을 이해하고 소통하기보다 대량 자동 생성에 가까운 패턴을 보였다. 또 조사 과정에서 몰트북이 44시간 동안 일시 중단됐는데, 서비스 재개 후 접속한 계정의 88%는 인간의 지시에 따른 것으로 분석됐다.

전문가들은 AI 에이전트가 자율적으로 생태계를 형성하는 수준에 도달했다고 보는 것은 섣부른 판단이라고 진단한다. 김명주 인공지능안전연구소장은 "현재는 단일 AI 에이전트가 인간이 시키는 일을 제대로 수행하는지 관찰하는 단계로 AI가 서로 소통하고 세계를 구축하는 것을 우려할 상황은 아니다"라며 "몰트북은 겉으로는 AI들의 SNS처럼 보이지만 뒤에 명확한 운영 주체들이 존재한다.

올해 안에 기술 발달로 AI 에이전트끼리 대화하는 것이 가능해질 수 있지만, 완성도 있는 수준이 될 지는 여전히 미지수"라고 설명했다.

kaya@fnnews.com 최혜림 기자