국제 국제경제

독극물 제조법 물었더니…대답 멈춘 AI

송경재 기자

파이낸셜뉴스

입력 2026.06.10 18:41

수정 2026.06.10 18:56

'미토스 쇼크' 안긴 앤스로픽, 보급형 모델 공개

앤스로픽이 9일(현지시간) 미토스급 인공지능(AI) 모델 '클로드 페이블 5'를 공개했다. 두 달 전 전 세계에 충격을 몰고 왔던 미토스에 버금가는 성능을 갖춘 모델이다. 악용을 우려해 제한된 사용자에게만 배포했던 미토스를 일반 대중이 사용할 수 있도록 보완했다.

(출처=연합뉴스)
(출처=연합뉴스)
보안·생물학 등 민감 분야에 안전장치 강화

앤스로픽은 이 모델에는 세이프가드가 장착됐다면서 사이버보안과 생물학 등 특별한 고위험 분야에는 대응을 막는 장치가 마련돼 광범위한 공개가 가능했다고 밝혔다. 지난주 기업공개(IPO) 신청서를 미국 증권거래위원회(SEC)에 제출한 앤스로픽이 상장 흥행몰이를 위해 미토스 일반판을 공개한 것으로 보인다.



앤스로픽 리서치 책임자 다이앤 펜은 CNBC에 "'정상을 향한 경쟁'과 연관돼 있다"면서 "해악보다 이득이 훨씬 더 크도록 적절한 안전장치를 제공할 수 있는 역량을 갖췄다"고 밝혔다.

앞서 앤스로픽은 지난 4월 미토스를 일부에 공개해 파란을 일으켰다. 미토스는 소프트웨어의 보안 허점을 찾아내는 데 탁월한 성능을 보이며 정부 관계자들을 긴장하게 만들었다. 당시 앤스로픽은 이를 일반에 공개하지 않기로 했다.

상장 앞두고 흥행몰이 위해 내놨다는 분석도

앤스로픽은 '클로드 페이블 5'가 소프트웨어 엔지니어링과 지식 업무 등 여러 분야에서 '압도적인 성능'을 보였다면서 일부 벤치마크에서는 지난해 말 공개한 '클로드 오퍼스 4.8'보다 10% 넘게 점수를 더 받았다고 밝혔다.
사용자가 예를 들어 라이신 같은 독극물을 어떻게 만드느냐 같은 위험이 높은 질문을 하면 이 모델은 대답을 중단하고 클로드 오퍼스 4.8로 되돌아가 안전한 답을 내놓도록 돼 있다는 설명이다.

앤스로픽은 아울러 이날 미토스 AI 모델도 업데이트해 '클로드 미토스 5'를 내놨다.
'클로드 페이블 5'와 같은 모델이지만 특정 분야에 대한 안전장치가 해제된 모델이다.dympna@fnnews.com 송경재 기자