IT 정보통신

코난테크놀로지, '코난보이스'에 최신 기술 적용.. 외국어 합성도 가능

구자윤 기자

파이낸셜뉴스

입력 2024.04.23 09:31

수정 2024.04.23 09:31

코난테크놀로지, '코난보이스'에 최신 기술 적용.. 외국어 합성도 가능

코난테크놀로지가 인공지능(AI) 음성합성 제작 서비스인 ‘코난보이스’에 최신 음성기술을 적용했다.

코난보이스는 사용자 목소리를 다양한 언어로 변환할 수 있는 새로운 음성합성 모델을 공개했다고 23일 밝혔다.

발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용해 한 사람의 목소리로 여러 언어의 음성 합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사할 수 있는 것이 장점이다. 기존 텍스트 기반 음성합성에서 진일보한 시도인 동시에 다국어 음성합성에 대한 고객들의 꾸준한 수요를 반영했다. 현재 한국어 및 영어를 제공하고 있으며 추후 일본어, 중국어 등으로 늘려갈 계획이다.


또한 최신 음성모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성해 화자의 표현력을 손실 없이 구현할 수 있게 됐다. Flow 기반의 최신 기법을 적용해 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 더 자연스러운 음성을 생성할 수 있게 됐다.

서비스도 업데이트됐다. 1080p FHD 해상도가 추가돼 고화질 영상 제작을 지원하고 자막 서비스가 신설돼 영상 품질과 제작 편의성을 높였다.


서영주 음성그룹 연구소 상무는 “코난보이스 사용자들이 더욱 다양하고 풍부한 콘텐츠를 쉽게 만들 수 있도록 앞으로도 최신 인공지능 음성기술 개발과 고도화에 박차를 가하겠다”고 말했다.

solidkjy@fnnews.com 구자윤 기자

fnSurvey