IT 정보통신

음성 인식, AI 시대 '주인공'이 되다

이설영 기자

파이낸셜뉴스

입력 2017.10.15 19:38

수정 2017.10.15 19:38

터치 줄고 음성명령 늘며 스마트 스피커 빠르게 확산
2021년 시장 35억弗 전망 쇼핑.길안내.택시호출 등 다양한 분야에 사용되면서 업계 '기술 고도화'에 사활
"정부 지원도 뒷받침돼야"
음성 인식, AI 시대 '주인공'이 되다

인공지능(AI) 기술이 급속히 대중화되면서 음성명령이 스마트 기기 명령체계의 주인공으로 급부상하고 있다. 과거 버튼 입력형에서 터치형으로, 터치형이 음성명령으로 급속이 전환되고 있는 것이다.

이 때문에 주요 글로벌 정보통신기술(ICT) 업체들은 앞다퉈 자연어 인식 기술 고도화에 투자를 집중하고 있다. 사용자와 자연스럽게 대화하면서 명령을 수행하는 스마트기기가 시장 주도권을 잡을 것이라는 예상 때문이다.

이와관련 국내에서도 한국어 자연어 음성인식 기술을 고도화하기 위한 정부 차원의 각별한 지원이 시급하다는 조언이 잇따르고 있다.

■"스마트 스피커, 2021년에 4조원 규모"

15일 업계에 따르면 현재 미국내 구글 검색에서 음성 검색이 차지하는 비중은 20%를 넘어서고 있다.
지난 2012년 음성검색 서비스를 시작한지 5년만에 음성검색의 영향력이 급속히 높아지고 있다는게 구글의 설명이다.

음성명령을 인식하는 첫 기기로 선보인 스마트 스피커는 급성장을 거듭하고 있다. 시장조사업체 가트너에 따르면 스마트 스피커 시장은 지난해 7억2000만달러(약 8200억원) 규모였는데 2021년에는 35억2000만달러(약 4조원)로 확대돼 5년새 5배 가까운 성장을 예고하고 있다.

스마트 스피커 시장 대표주자인 아마존 에코는 지난 2014년 첫선을 보인 뒤 약 3년만인 2017년 1.4분기 기준 미국에서만 약 1100만대가 실제 사용되고 있다. 1년 전만 해도 실제 이용되고 있는 에코의 숫자는 300만대였는데 1년만에 4배 가까이 시장이 늘어난 것이다.

시장조사업체인 e마케터에 따르면 현재 미국의 스마트 스피커 이용자수는 3600만명으로 추산된다. 전체 인구 약 3억2000만명의 10% 이상이 스마트 스피커를 이용하는 것이다. 세계이동통신사업자협회(GSMA)는 최근 발간한 '글로벌 모바일 트렌드 2017' 보고서를 통해 "스마트 스피커는 아직 기능의 한계 때문에 완전히 시장에 안착했다고 하기는 힘들지만 다양한 기능들이 빠르게 증가하고 있다"며 "스마트 스피커는 스마트홈을 제어하는 도구로 스마트폰과 경쟁 대상이 될 것"이라고 내다봤다.

■음성 인식 기술.기능 진화 중

음성인식 기술도 갈수록 빠르게 진화하고 있다.

우선 아마존의 AI인 알렉사를 음성으로 제어하는 스마트 스피커 에코의 기능은 1년새 15배 이상의 기능 확장을 기록하고 있다. 알렉사를 음성으로 조작할 수 있는 기능을 '알렉사 스킬'이라고 부르는데 쇼핑 주문, 음악 재생, 날씨 정보 제공, 뉴스 제공, 우버 호출 등이 대표적인 알렉사 스킬이다. 알렉사 스킬은 지난해 2.4분기까지만 해도 1000개 가량이었는데 1년이 지난 올해 2.4분기에 1만5000개로 15배나 늘었다.

삼성전자의 음성기반 AI인 빅스비도 진화하고 있다. 빅스비는 올해 초 삼성전자가 갤럭시S8을 출시하며 첫 선을 보인 뒤 갤럭시노트8에도 탑재됐다. 음성 서비스는 지난 5월부터 시작됐는데 초기 한국어만 지원하던 서비스가 지난 7월 영어서비스를 추가하더니 8월에는 전세계 200개국에서 빅스비 음성 서비스를 이용할 수 있도록 발전했다.

스마트폰을 손가락으로 조작하는 것에 익숙한 사람들은 막상 음성으로 뭔가를 요청하는 것에 익숙하지 않다. 이에 따라 삼성전자는 최근 빅스비 음성을 지원하는 애플리케이션(앱)으로 음성을 이용해 어떤 것들을 할 수 있는지 다양한 예시를 보여주는 기능을 추가했다. 예를 들어 캘린더를 연 뒤 "여기서 뭘 할 수 있는데?"라고 질문하면 "캘린더에서 미팅 일정 찾아줘" "캘린더에서 내일 오전 7시에 회의 일정 추가해줘" 등을 할 수 있다며 예시를 수십가지 보여준다.

내비게이션도 음성명령이 대세로 자리잡고 있다. 운전 중 목적지 설정을 바꾸거나 할 때는 터치방식 보다 음성명령이 사고의 위험을 줄일 수 있다.
지난해 9월부터 음성명령 기능을 추가한 카카오내비는 최근 기능을 업데이트 해 카카오내비가 실행된 상태에서 스마트폰에 손을 가까이 대면 음성명령을 받을 준비가 되도록 했다. SK텔레콤의 T맵도 최근 AI '누구'의 기능을 추가해 음성명령으로 T맵을 조작할 수 있도록 했다.


업계 한 관계자는 "스마트기기 명령 방식이 빠르게 으,ㅁ성명령으로 전환되고 있다"며 "음성명령의 핵심은 사람이 말하는 내용의 맥락을 인식해 자연스러운 대화가 가능하도록 하는 것이어서 자연어 인식 기술에 대한 기업과 정부의 적극적인 지원이 시급한 상황"이라고 강조했다.

ronia@fnnews.com 이설영 기자

fnSurvey