국내 중소형AI 최고 성능은 KT가 만든 '믿음 K'

파이낸셜뉴스       2026.01.05 18:17   수정 : 2026.01.05 18:17기사원문
플랫폼 'AAII' 평가에서 1위 기록
효율·추론 능력 갖춰 B2B 최적화

KT는 자체 개발한 인공지능(AI) 모델 '믿음 K'가 글로벌 AI 모델 성능을 종합 평가하는 플랫폼 'AAII'에서 국내 중소형 모델 중 1위를 달성했다고 5일 밝혔다.

KT는 에이전틱 AI 분야에서 높은 성적을 거두며 대한민국 AI의 저력을 증명했다고 설명했다. 이번 평가에서 믿음 K는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여개 핵심 평가 항목에서 우수한 점수를 기록했다.

KT는 이번 성과를 바탕으로 기업 고객이 손쉽게 도입할 수 있는 '작지만 강한' AI 모델로 국내 기업 간 거래(B2B) 시장 공략에 박차를 가할 방침이다.

이번 AAII 공개 결과에서 믿:음 K는 주요 에이전트 성능 벤치마크 중 하나인 '타우 스퀘어 벤치(τ²-bench)'에서 87%를 기록했다. 타우 스퀘어 벤치는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 에이전트 특화 벤치마크다. KT는 믿:음 K가 기록한 수치는 최정상 수준이며 구글의 최신 모델인 제미나이3와도 어깨를 나란히 하고 있다고 밝혔다.

믿음 K는 전문 지식과 고난도 추론 능력을 평가하는 MMLU Pro, GPQA, HLE 등 주요 벤치마크에서도 고르게 우수한 성적을 거뒀다. 특히 한국어 이해 성능 지표에서는 국내 최고 수준을 달성했다. 이러한 성과는 매개변수 40B 이하급 모델에서 구현됐다는 점에서 유의미하다는 평가다.

KT는 최근 기업들이 자사만의 특화된 AI 에이전트 서비스를 개발하고자 하는 니즈를 파악했다. 이에 고품질 데이터 확보를 위해 국내외 주요 데이터 보유 기관들과 '데이터 얼라이언스'를 결성하고 저작권이 확보된 고품질 데이터를 학습에 활용했다. 또 주요 B2B 고객사들과 협력하며 현장에서 실제로 작동하는 모델을 만들기 위해 노력해 왔다. 한국 기업의 업무 환경을 이해하면서 성능과 경제성을 갖춘 믿:음 K는 국내 기업의 AI 전환에 속도를 낼 전망이다.


KT는 믿음 K를 국내 B2B 시장에 최적화된 에이전틱 AI 모델로 본격 확산할 계획이다. 금융·공공·제조 등 산업별로 기업의 실제 업무를 자동화하고 스스로 판단해 처리하는 맞춤형 AI 에이전트를 제공해 기업 고객의 AI 전환(AX)을 선도하겠다는 전략이다. 오승필 KT 기술혁신부문장 부사장은 "이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업들의 업무 혁신과 디지털 전환을 이끄는 최고의 AI 파트너가 되겠다"고 말했다.

최혜림 기자

Hot 포토

많이 본 뉴스