오픈AI, 전문 업무용 'GPT-5.4' 공개…"산업 전문가 수준"
뉴시스
2026.03.06 09:19
수정 : 2026.03.06 09:19기사원문
챗GPT·API·코덱스 전반에서 활용하는 차세대 모델 "가장 뛰어나고 효율적인 프론티어 모델"
[서울=뉴시스]오동현 기자 = 오픈AI가 6일 전문적인 업무 수행을 위한 인공지능(AI) 모델 'GPT-5.4'를 공개했다.
GPT-5.4는 챗GPT, 응용 프로그래밍 인터페이스(API), 코덱스(Codex) 등 오픈AI의 주요 제품 전반에 적용되는 가장 뛰어나고 효율적인 프론티어 모델로, 추론 능력과 코딩 성능, 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징이다.
이를 통해 복잡한 실제 업무를 보다 정확하고 효율적으로 수행할 수 있으며, 사용자가 원하는 결과를 얻기까지 필요한 반복 작업도 줄였다.
성능 측면에서도 주요 벤치마크에서 의미 있는 개선을 보였다. AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 비교 중 83%에서 산업 전문가와 동등하거나 더 높은 수준의 결과를 보였다. 이는 GPT-5.2의 71.0%보다 크게 향상된 결과다. GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가한다.
오픈AI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 상회했다. 프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께, 모델의 사실 정확성도 개선됐다.
또한 GPT-5.4는 오픈AI가 공개한 범용 모델 가운데 컴퓨터 사용(computer-use) 능력을 기본적으로 탑재한 최초의 범용 모델이다. 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업 흐름을 수행할 수 있다. GPT-5.4는 최대 100만 토큰(1M tokens)의 컨텍스트를 지원해 장시간 작업을 계획하고 실행하며 검증하는 에이전트 시스템 구축에도 적합하다. 이러한 기능은 웹 브라우징, 데스크톱 환경 조작, 멀티모달 이해 등 다양한 벤치마크에서도 높은 성능으로 확인됐다.
챗GPT에서 제공되는 GPT-5.4(GPT-5.4 Thinking 선택해 사용 가능)는 새로운 작업 방식도 도입했다. 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시해 사용자가 응답 생성 중에도 방향을 조정할 수 있도록 한다. 이를 통해 추가 대화를 반복하지 않아도 원하는 결과에 보다 빠르게 도달할 수 있다. 또한 웹 기반 심층 조사 능력이 강화돼 여러 출처의 정보를 종합해야 하는 복잡한 질문에서도 더 정확하고 일관된 답변을 제공한다.
GPT-5.4는 대규모 도구 환경에서도 효율적으로 작동하도록 도구 검색(tool search) 기능을 도입했다. 이를 통해 에이전트는 다양한 도구와 커넥터가 연결된 환경에서 필요한 도구를 더 정확하게 찾아 사용할 수 있으며, 토큰 사용량과 응답 지연도 줄일 수 있다.
GPT-5.4는 GPT-5.2 대비 문제 해결에 필요한 토큰 수를 크게 줄인 가장 효율적인 추론 모델로, 동일한 작업을 더 빠르고 비용 효율적으로 수행할 수 있다.
오픈AI는 "GPT-5.4를 통해 기업과 전문가들이 복잡한 업무를 더 빠르고 정확하게 수행하고, AI 에이전트를 활용한 새로운 업무 방식이 확산될 것으로 기대하고 있다"고 전했다.
☞공감언론 뉴시스odong85@newsis.com <저작권자ⓒ 공감언론 뉴시스통신사. 무단전재-재배포 금지.>
저작권자ⓒ 공감언론 뉴시스통신사. 무단전재-재배포 금지