관련종목▶
삼성전자는 이를 통해 글로벌 기업들의 AI 활용 수준을 가늠할 새로운 기준을 제시한다는 계획이다. 특히 노태문 삼성전자 디바이스경험(DX)부문장 사장이 최근 유럽 최대 가전 전시회 IFA 2025에서 "전 업무 영역의 90%에 AI를 적용해 AI가 현장에서 판단하고 결정할 수 있도록 하겠다"고 강조한 만큼, AI 업무 생산성 평가에 집중하는 행보로 풀이된다.
25일 업계에 따르면 삼성전자 '트루벤치'는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크로 AI 모델의 업무 생산성 성능을 평가한다.
이번에 삼성전자가 공개한 '트루벤치'의 평가 항목은 10개 카테고리, 46개 업무, 2485개의 세분화된 항목으로 구성돼 있다. 이에 사용자의 짧은 요청부터 최대 2만자의 긴 문서 요약까지 실제 업무 상황을 폭넓게 평가하게 된다.
평가 결과도 기존 벤치마크와 차별화했다. 사용자는 한 번에 최대 5개 모델을 비교할 수 있어 다양한 AI 모델의 성능을 한눈에 파악할 수 있다.
soup@fnnews.com 임수빈 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지