IT 정보통신

오픈AI 챗GPT 이제 보고 듣고 말한다...시리, 알렉사와 진검승부

홍창기 기자

파이낸셜뉴스

입력 2023.09.26 07:32

수정 2023.09.26 07:32

업그레이드된 오픈AI 챗GPT 음성 대화 기능 도입
챗GPT 목소리는 '딥페이크' 우려 나와
챗GPT 이미지 분석 기능도 탑재

오픈AI의 생성형 AI(인공지능) 챗봇 챗GPT가 음성 대화 기능을 추가한 업그레이드 버전을 내놨다. 챗GPT는 애플의 시리와 아마존의 알렉사와 달리 이미지를 분석할 수 있는 기능도 탑재됐다. /사진=AFP연합뉴스
오픈AI의 생성형 AI(인공지능) 챗봇 챗GPT가 음성 대화 기능을 추가한 업그레이드 버전을 내놨다. 챗GPT는 애플의 시리와 아마존의 알렉사와 달리 이미지를 분석할 수 있는 기능도 탑재됐다. /사진=AFP연합뉴스

【실리콘밸리=홍창기 특파원】

전 세계에 AI(인공지능) 붐을 일으킨 오픈AI의 생성형 AI 챗GPT가 이제 보고 듣고 말한다. 챗GPT 기능이 업그레이드 된 것인데 오픈AI의 업그레이드는 마이크로소프트(MS)와 구글 등과 같은 챗봇 리더들 간의 경쟁이 점점 더 치열해지고 있는 가운데 이뤄졌다.


25일(현지시간) 오픈AI는 챗GPT가 대화를 하며 음성으로 응답하고 이미지도 처리할 수 있게 됐다고 발표했다. GPT-4 도입 이후 오픈AI의 가장 큰 업그레이드다.

챗GPT가 사용자와 대화를 하며 음성으로 답하는 것은 아마존의 알렉사(Alexa)나 애플의 시리(Siri), 구글 어시스턴트(Google Assistant)와 비슷한 기능이다. 사용자는 챗GPT의 모바일 앱에서 음성 대화를 선택하고 챗GPT 봇이 응답할 5가지 음성 중에서 하나를 선택할 수 있다.

전문가들은 AI로 생성된 합성 음성에 대한 우려를 제기하고 나섰다.

합성 음성이 사용자에게 더 자연스러운 경험을 제공할 수 있지만 더 그럴듯한 딥페이크(AI를 이용해 진짜처럼 보이게 하는 기술)도 가능해질 수 있기 때문이다. 이런 우려로 연구자들은 이미 딥페이크가 사이버 보안 시스템에 침투하는 데 어떻게 사용될 수 있는지 연구하기 시작했다.

오픈AI는 이를 인식한 듯 이날 "챗GPT의 합성 음성은 낯선 사람에게서 수집한 것이 아니라 우리가 직접 작업한 성우를 통해 만들어졌다"고 강조했다.

다만 오픈AI는 챗GPT 이용자의 음성 입력을 어떻게 사용할 것인지 또 자사가 해당 데이터를 어떻게 보호할 것인지에 대한 정보는 공개하지 않았다.

CNBC는 "이 회사의 서비스 약관은 관련 법률이 허용하는 범위 내에서 소비자가 자신의 입력 정보를 소유한다고 명시하고 있다"고 전했다.

오픈AI는 음성 상호 작용에 대한 회사의 지침을 CNBC에 소개했는데 여기에는 오픈AI가 오디오 클립을 보유하지 않으며 오디오 클립 자체는 모델을 개선하는 데 사용되지 않는다고 명시됐다.

한편, 오픈AI의 챗GPT가 알렉사와 시리, 구글어시스턴트와 다른 점은 사용자와 챗GPT가 이미지를 공유하고 해당 이미지에 대해서도 분석할 수 있다는 점이다.

한편, 모든 챗GPT 사용자가 이 기능을 이용할 수 있는 것은 아니다.
돈을 내고 챗GPT를 사용하는 이용자들이 이 기능을 사용할 수 있으며 이 변경 사항은 2주 내에 적용될 예정이다. 음성 기능은 iOS와 안드로이드 앱으로 제한된다.
다만 이미지 처리 기능은 모든 플랫폼에서 사용할 수 있다.

오픈AI의 CEO(최고경영자) 샘 올트먼 /사진=로이터연합뉴스
오픈AI의 CEO(최고경영자) 샘 올트먼 /사진=로이터연합뉴스


theveryfirst@fnnews.com 홍창기 기자

fnSurvey