별도의 앱 전환 없이 자연스러운 대화 데이터 확보
객체 인식 등 AI 학습 모델에 적합한 고품질 통화 데이터 구축
[서울=뉴시스] 오동현 기자 = 인공지능(AI) 언어 데이터 전문 기업 플리토는 자사 모바일 애플리케이션 내 음성 데이터 수집 기능인 ‘아케이드 토킹 미션’을 고도화하며, 실사용 환경에 근접한 고품질 음성 데이터를 안정적으로 수집·가공할 수 있는 인프라를 강화했다고 14일 밝혔다.
이번 프로젝트는 글로벌 빅테크 기업의 수요에 기반해 기획된 것으로, 실제 사용자 간 자연스러운 통화 데이터를 정밀하게 수집한 뒤 체계적인 정제 및 라벨링 작업까지 완료함으로써, 음성인식(STT), 자연어처리(NLP), 객체 인식 등 다양한 AI 모델의 정교화에 최적화된 고정밀 학습용 데이터를 구축하는 데 초점을 맞추고 있다.
플리토의 아케이드 토킹 미션은 별도의 외부 앱이나 통화 연결 없이, 플리토 앱 내에서 직접 통화 기능을 활용해 대화를 진행하는 방식으로 설계됐다. 사전에 설정된 상황과 키워드를 바탕으로 사용자 간 자유로운 통화가 이뤄지며, 스크립트 기반의 인위적 대화 없이 실제 일상과 유사한 자연스러운 데이터 확보가 가능하다.
이번 고도화를 통해 플리토는 ▲앱 내 통화 기능의 완전 내재화 ▲상황 기반 자유 대화 설계 ▲참여 간소화 및 고품질 기준 정립 ▲AI 학습용에 최적화된 제출 포맷 구축 등 전 주기적 음성 데이터 수집·가공 체계를 일원화했다.
초기에는 한국어와 일본어를 중심으로 수집을 시작하며, 점진적 확대를 통해 아랍어, 말레이시아어, 중국어, 영어 등 다양한 언어군으로 확장할 계획이다. 완성된 음성 데이터셋은 플리토 고유의 품질 검수 프로세스를 거쳐 글로벌 빅테크 기업 및 주요 연구기관 등에 공급된다.
이정수 플리토 대표는 “이번 아케이드 토킹 미션 고도화는 기존 음성 데이터 수집 방식의 범위를 확장하며, 실제 사용 환경을 반영한 자연스러운 데이터를 안정적으로 확보할 수 있는 기반을 마련한 데 큰 의미가 있다”며 “플리토는 음성 데이터를 단순히 수집하는 데 그치지 않고, 정제와 라벨링까지 전 과정을 자체 수행하는 전문 데이터 기업으로서 앞으로도 다양한 언어와 상황에 최적화된 학습 데이터를 지속적으로 구축해 글로벌 AI 산업의 정밀화와 활용 저변 확대에 기여해 나가겠다”고 말했다.
☞공감언론 뉴시스 odong85@newsis.com <저작권자ⓒ 공감언론 뉴시스통신사. 무단전재-재배포 금지.>
저작권자ⓒ 공감언론 뉴시스통신사. 무단전재-재배포 금지