美 AI 기업 오픈AI, 11일 최신작 'GPT-5.2' 공개
3가지 모드로 작동, 경쟁 제품보다 성능 우수하다고 주장
구글 '제미나이' 맹추격으로 중대 경보, 한 달 만에 신제품 공개
3가지 모드로 작동, 경쟁 제품보다 성능 우수하다고 주장
구글 '제미나이' 맹추격으로 중대 경보, 한 달 만에 신제품 공개
[파이낸셜뉴스] 최근 구글 ‘제미나이’의 맹추격에 쫒기는 미국 인공지능(AI) 기업 오픈AI가 최신 거대언어모델(LLM)인 ‘GPT-5.2’를 공개했다. 해당 제품의 성능은 경쟁사인 구글의 '제미나이'를 앞지른 것으로 추정된다.
오픈AI는 11일(현지시간) 홈페이지를 통해 GPT-5.2를 공개하고 “전문 지식 업무에서 가장 뛰어난 성능의 모델”이라고 주장했다. GPT같은 LLM은 사람의 언어 작업을 위해 설계된 생성형 AI 중 하나이며 대규모로 인간의 문자나 문장을 인식, 번역, 예측 및 생성할 수 있다. 오픈AI의 ‘챗GPT’는 GPT에 채팅 로봇을 결합한 서비스다.
오픈AI는 GPT-5.2가 이전의 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 총 3가지 모드로 구성됐다고 밝혔다. 즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다. 또한 프로 모드는 보다 긴 작업시간이 필요한 어려운 질문에 적합한 도구다.
오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 비교평가(벤치마크)에서 최고 수준을 달성했다고 강조했다. 회사 측은 GPT-5.2의 사고 모드가 전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 시험에서 70.9%, 프로 모드는 74.1%의 점수를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖추었다고 주장했다. 특히 GPT-5.2 사고 모드의 성능은 이전 버전인 GPT-5(38.8%)와 비교해 크게 나아졌다.
오픈AI 이번 발표에서 컴퓨터 프로그램 작성에 AI를 투입하는 최근 IT 업계 분위기를 의식해 자사 제품의 프로그래밍 능력을 강조했다. GPT-5.2의 사고 모드는 소프트웨어 작업 능력을 평가하는 SWE 벤치마크에서 80%를 기록, 경쟁사 구글의 ‘제미나이3 프로’의 성능(76.2%)을 능가했다. 이는 코딩 능력이 뛰어난 것으로 알려진 또 다른 경쟁사 앤트로픽의 ‘클로드 오퍼스4.5(80.9%)’와 거의 차이가 없는 수준이다.
오픈AI는 자사 제품이 '인간의 마지막 시험'으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 경쟁사를 이겼다고 주장했다. GPT-5.2 프로 모드는 별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 36.6%의 점수를 기록했다. 이는 제미나이3 프로의 37.5%보다 소폭 낮은 수준이다. 하지만 GPT-5.2 프로 모드는 검색 등 도구를 사용해서 진행한 평가에서 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.
AI의 환각 현상도 크게 줄였다. 내부 테스트 결과 GPT-5.2 사고모드의 오류율은 6.2%로 전작인 GPT-5.1 사고모드(8.8%)와 견줘 약 30% 감소했다.
GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다. 새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.
오픈AI가 지난달 12일 GPT-5.1 공개 이후 한 달도 지나지 않아 새 제품을 공개한 것은 경쟁작을 의식한 결과로 추정된다. 미국 LLM 벤치마크 비교 플랫폼인 LM아레나에 따르면 지난 3일 기준 277개 LLM 가운데 종합 순위 1위는 구글의 제미나이3였다. 지난 2023년 ‘제미나이1’로 처음 공개된 해당 제품은 빠른 속도로 선발주자인 GPT를 따라잡았다. GPT 5.1의 순위는 지난 3일 종합 6위에 그쳤다.
월스트리트저널(WSJ) 등 현지 매체들에 따르면 샘 올트먼 오픈AI 최고경영자(CEO)는 지난달 18일 제미나이3 프로 출시 이후 직원들에게 다른 일을 제쳐두고 챗GPT 성능과 사용성 개선에 집중하라고 주문했다. 올트먼은 지난 1일 사내 공지에서 중대경보(코드레드)를 발령했다. 오픈AI는 내년 1월에 또다시 새로운 모델을 선보인 이후 경보를 해제할 예정이라고 알려졌다.
pjw@fnnews.com 박종원 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지