삼성전자, AI 업무 생산성 측정하는 ‘트루벤치’ 공개
파이낸셜뉴스
2025.09.25 18:07
수정 : 2025.09.25 18:07기사원문
삼성전자가 자체 개발한 인공지능(AI) 업무 생산성 벤치마크 '트루벤치'를 공개했다. 트루벤치는 기존 영어 중심·단편 대화 위주의 AI 모델 업무 생산성 평가를 넘어 실제 문서 요약, 번역, 질의응답 등 다양한 업무 상황을 세밀하게 측정할 수 있도록 설계된 것이 특징이다.
삼성전자는 이를 통해 글로벌 기업들의 AI 활용 수준을 가늠할 새로운 기준을 제시한다는 계획이다.
특히 노태문 삼성전자 디바이스경험(DX)부문장 사장이 최근 유럽 최대 가전 전시회 IFA 2025에서 "전 업무 영역의 90%에 AI를 적용해 AI가 현장에서 판단하고 결정할 수 있도록 하겠다"고 강조한 만큼, AI 업무 생산성 평가에 집중하는 행보로 풀이된다.
이번에 삼성전자가 공개한 '트루벤치'의 평가 항목은 10개 카테고리, 46개 업무, 2485개의 세분화된 항목으로 구성돼 있다. 이에 사용자의 짧은 요청부터 최대 2만자의 긴 문서 요약까지 실제 업무 상황을 폭넓게 평가하게 된다.
평가 결과도 기존 벤치마크와 차별화했다. 사용자는 한 번에 최대 5개 모델을 비교할 수 있어 다양한 AI 모델의 성능을 한눈에 파악할 수 있다.
soup@fnnews.com 임수빈 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지