IT 보안/해킹

[두유노우] 사람과 컴퓨터를 구별한다.. '캡차'란?

이혜진 기자

파이낸셜뉴스

입력 2021.01.17 08:50

수정 2021.02.01 08:55

캡차 통해 인류 유산 복원하기도
[두유노우] 사람과 컴퓨터를 구별한다.. '캡차'란?

[파이낸셜뉴스] 웹사이트에서 회원가입 또는 로그인을 할 때 왜곡된 글자를 입력하거나 특정 사물이 포함된 타일을 선택하라는 창이 뜨는 경우가 있다.

간혹 '로봇이 아닙니다'라는 체크박스도 뜨곤 한다. 이러한 과정을 거쳐야 하는 이유는 무엇일까?

'로봇이 아닙니다'를 클릭해야 하는 이유

이는 웹사이트 사용자가 사람인지 컴퓨터 프로그램인지 구별하기 위해 사용하는 기술인 캡차(CAPTCHA)다.

캡차는 사람과 컴퓨터를 구분하는 자동화된 튜링 테스트(Completely Automated Public Turing Test To Tell Computers and Humans Apart)의 줄임말이다.

자동 프로그램인 봇(bot)이 무차별적으로 웹사이트를 공격하거나 계정을 해킹하는 것을 막기 위해 만들어진 기술이다.


컴퓨터 프로그램은 디지털화가 되지 않은 글자나 왜곡된 글자를 인식하지 못한다.

캡차는 왜곡된 글자를 제시하고 이를 맞추는 테스트를 통해 사람과 컴퓨터를 구별하는 것이다.

텍스트 캡차 외에도 간단한 연산의 답을 묻는 '연산 캡차', 난독증이나 시각 장애를 가진 사람들을 위한 '오디오 캡차', 사진에서 특정 사물을 구별하는 '이미지 캡차' 등이 있다.

'로봇이 아닙니다' 체크박스도 캡차 기술의 일종이다. 마우스의 움직임이나 클릭 속도 등을 감지해 사람과 컴퓨터를 구별한다.



캡차 풀었을 뿐인데.. 고문서가 복원된다?

캡차 기술은 인류의 유산을 복원하는 작업에 활용되기도 했다.

2007년, 캡차 개발팀은 기존 기술을 기반으로 한 '리캡차(RECAPTCHA)'를 고안해냈다.

리캡차는 컴퓨터가 답을 알고 있는 단어와 디지털화가 필요한 고문서의 단어를 동시에 제시한다.


사용자가 단어를 입력하면 이미 답을 아는 단어로 사람과 봇을 가려내고, 고문서의 단어도 정답으로 간주한다.

이때 높은 비율로 입력된 단어는 고문서를 디지털로 복원할 때 활용된다.


리캡차 기술을 통해 매일 약 1억 개의 단어가 확인됐으며 연간 250만 권의 책이 디지털로 복원됐다.

sunset@fnnews.com 이혜진 기자 , 임예리 인턴기자

fnSurvey