
[파이낸셜뉴스] 인공지능(AI) 언어 데이터 전문 기업 플리토는 자사 모바일 애플리케이션 내 음성 데이터 수집 기능인 ‘아케이드 토킹 미션’을 고도화하며, 실사용 환경에 근접한 고품질 음성 데이터를 안정적으로 수집·가공할 수 있는 인프라를 대폭 강화했다고 14일 밝혔다.
이번 프로젝트는 글로벌 빅테크 기업의 수요에 기반해 기획된 것으로, 실제 사용자 간 자연스러운 통화 데이터를 정밀하게 수집한 뒤 체계적인 정제 및 라벨링 작업까지 완료함으로써, 음성인식(STT), 자연어처리(NLP), 객체 인식 등 다양한 AI 모델의 정교화에 최적화된 고정밀 학습용 데이터를 구축하는 데 초점을 맞추고 있다.
플리토의 아케이드 토킹 미션은 별도의 외부 앱이나 통화 연결 없이, 플리토 앱 내에서 직접 통화 기능을 활용해 대화를 진행하는 방식으로 설계됐다. 사전에 설정된 상황과 키워드를 바탕으로 사용자 간 자유로운 통화가 이뤄지며, 스크립트 기반의 인위적 대화 없이 실제 일상과 유사한 자연스러운 데이터 확보가 가능하다.
특히 이번 고도화를 통해 플리토는 △앱 내 통화 기능의 완전 내재화 △상황 기반 자유 대화 설계 △참여 간소화 및 고품질 기준 정립 △AI 학습용에 최적화된 제출 포맷 구축 등 전 주기적 음성 데이터 수집·가공 체계를 일원화했다.
이 데이터는 언어별 특성과 사용 환경을 정밀하게 반영해 설계되며, 초기에는 한국어와 일본어를 중심으로 수집을 시작한다. 점진적 확대를 통해 아랍어, 말레이시아어, 중국어, 영어 등 다양한 언어군으로 확장할 계획이다. 완성된 음성 데이터셋은 플리토 고유의 품질 검수 프로세스를 거쳐 글로벌 빅테크 기업 및 주요 연구기관 등에 공급된다.
이정수 플리토 대표는 “이번 아케이드 토킹 미션 고도화는 기존 음성 데이터 수집 방식의 범위를 확장하며, 실제 사용 환경을 반영한 자연스러운 데이터를 안정적으로 확보할 수 있는 기반을 마련한 데 큰 의미가 있다”며 “앞으로도 다양한 언어와 상황에 최적화된 학습 데이터를 지속적으로 구축해 글로벌 AI 산업의 정밀화와 활용 저변 확대에 기여해 나가겠다”고 말했다.
yjjoe@fnnews.com 조윤주 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지