다만 GPT-5.2 모델의 성능을 둘러싼 신뢰성 논란 등이 불거지며 인공지능(AI) 업계 주도권을 실질적으로 위협받고 있다는 평가가 나온다.
10일 IT 업계에 따르면 미국 IT 매체 더버지 등은 오픈AI가 이달 말 발표 예정이던 GPT-5.2를 이르면 9일(현지시간) 출시하는 방안을 검토하고 있다고 보도했다. 더버지는 개발 진행 상황·서버 용량 등의 문제로 일정은 변동될 수 있다고 설명했다.
GPT-5.2의 9일 출시는 불발된 상태다.
업계에서는 GPT-5.2를 둘러싼 '가짜 벤치마크 유포 논란'이 영향을 끼쳤을 것으로 보고 있다.
마크 첸 오픈AI 최고연구책임자(CRO)는 지난주 내부 브리핑에서 차세대 모델(코드명 갈릭·Garlic)이 구글 제미나이3와 앤트로픽 '클로드 오퍼스 4.5를 코딩·추론 능력에서 앞섰다고 강조했다.
올트먼도 내부 메모에서 "GPT-5.2가 내부 평가에서 제미나이 3보다 앞서 있다"고 언급했다.
이달 6일(현지시간)엔 X(옛 트위터)·레딧에 GPT-5.2의 향상된 성능을 뒷받침하는 GPT-5.2 벤치마크가 유포됐다.
그러나 링크드인 AI 전문가들은 해당 벤치마크 자료가 제미나이 3 점수를 그대로 복사한 가짜라고 확인했다. 가짜 벤치마크는 과거 허위 정보를 유포한 이력이 있는 출처에서 나온 것으로 전해졌다.
블록체인 기술 기반 예측 시장 플랫폼 폴리마켓에선 오픈AI가 차세대 모델을 발표한다 해도 제미나이3의 성능 우위가 유지될 것으로 예측되고 있다.
현재 '2025년 말 최강 모델 보유 기업' 질의에 구글은 약 76%를 기록했지만, 오픈AI는 18.1%에 그치고 있다.
올트먼은 제미나이 3 성능을 재역전하고자 이달 1일(현지시간) '코드 레드'를 발동하며 수익화 프로젝트 전면 중단 등의 파격 결단을 내렸다.
올트먼은 내부 메모에서 챗GPT가 매우 중요한 시점에 와 있고 (성능) 개선에 총력을 다해야 한다며 챗GPT의 △성능 △개인 맞춤화 △안정성 △처리 범위 등을 전반적으로 끌어올려야 한다고 강조한 것으로 알려졌다.
또 오픈AI가 그간 추진한 신규 프로젝트(△쇼핑·건강 AI 에이전트 △챗GPT 광고 사업 △펄스 등)를 잠정 중단했다. 펄스는 이용자의 수면 시간에 백그라운드에서 비동기적으로 리서치를 수행하고 아침에 개인화된 브리핑 카드를 제공하는 기능으로 올해 9월 25일(현지시간) 출시됐다.
※ 저작권자 ⓒ 뉴스1코리아, 무단전재-재배포 금지