[파이낸셜뉴스] 챗GPT를 만든 미국 오픈AI가 GPT-3.5의 업그레이드 버전인 GPT-4를 발표하면서 어떤 성능이 개선됐는지 주목된다.
16일 업계에 따르면 오픈AI는 지난 14일 대규모 AI 언어 모델(LLM) GPT-4를 공개했다. 지난해 11월 챗GPT를 내놓은 지 약 4개월 만이다. 한때 GPT-4는 GPT-3의 매개 변수(파라미터) 규모인 1750억개를 뛰어넘은 1조개 이상의 매개 변수를 갖출 것이라는 추측이 나왔지만, 오픈AI는 GPT-4 매개 변수 규모를 공개하지 않았다.
요리재료 사진만 봐도...가능한 요리 답해
다만 업계에서는 확실히 '더 똑똑해진 모델"이라는 평가가 나온다.
이미지를 보고 이해할 수 있게 됐고 언어 구사력과 기억력, 영어 이외의 외국어 실력도 전반적으로 향상됐기 때문이다. 오픈AI에 따르면 GPT-4는 기존 GPT-3.5와 달리 텍스트뿐 아니라 이미지까지 여러 데이터 형태를 인식하는 멀티모달(복합 정보 처리) 모델이다.
문자로만 대화할 수 있었던 데서 사진과 문자를 결합한 질문도 이해하고 답변할 수 있게 발전한 것이다. 계란과 밀가루, 버터, 우유 사진을 올리고 "이걸로 요리할 수 있는 게 뭐지?"라고 물으면 "팬케이크나 와플, 프렌치토스트 등등"이라고 답하는 식이다.
언어 능력 자체도 향상됐다. 처리할 수 있는 단어량은 2만5000단어로 챗GPT보다 약 8배가 늘어났다. 대화 내용을 기억할 수 있는 능력도 대폭 늘어났다. 미국 IT 전문 매체 테크크런치는 "GPT 3.5는 책 4∼5페이지에 해당하는 4096 토큰(메모리 단위)을 보유했는데, GPT-4는 최대 책 50페이지 수준인 3만2768 토큰을 보유했다"면서 "희곡이나 단편 하나를 통째로 외울 수 있다는 의미"라고 소개했다.
'환각현상' 크게개선...GPT-3.5 보다 40%↑
GPT-3.5의 문제였던 '환각 현상'도 크게 개선했다고 오픈 AI는 설명했다.
이는 AI가 틀린 정보나 무의미한 내용을 마치 환각을 보는 듯이 그럴듯하게 제시하는 현상이다. 오픈AI는 "GPT-4는 내부 사실성 평가에서 최신 GPT-3.5보다 40% 높은 점수를 받았다"고 했다. 한국어 등 비영어 언어 성능도 향상됐다. 오픈AI가 시험한 26개 언어 가운데 GPT-4는 한국어와 일본어, 프랑스어 등 24개 언어에서 GPT-3.5가 영어를 하는 수준보다 더 높은 성능을 보였다.
다만 GPT-4의 혁신적 변화에도 아직 인간과 동일한 수준의 능력을 갖춘 것은 아니라 엉뚱한 답을 내놓을 수 있다는 한계가 지적됐다. AI 스타트업 업스테이지의 박은정 최고과학책임자(CSO)는 "GPT-4는 사람들이 많이 물어보지 않거나 온라인에 정보가 없는 '롱테일 질문', 지식을 단순히 불러올 뿐 아니라 특정 연산을 통해 정보를 소화해야 하는 '추론형 질문'은 잘 답할 수 없다"고 말했다.
yon@fnnews.com 홍요은 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지