IT 보안/해킹

[IT 뜯어보기] 개인정보 비식별화-재식별화

허준 기자

파이낸셜뉴스

입력 2018.03.06 15:00

수정 2018.03.06 15:00

4차 산업혁명 시대 맞춤형 융합 서비스 제공을 위해 기업들이 개인정보를 활용할 수 있도록 해야 한다는 의견과 개인정보가 무분별하게 사용되지 않도록 보호하는 것이 중요하다는 주장이 첨예하게 대립하고 있다. 전문가들은 4차 산업혁명 시대의 원유라고 불리는 데이터를 활용하기 위해 기업들의 개인정보 수집은 필수적이기 때문에 최대한 개인임을 식별할 수 없도록 하는 방향으로 정책을 제시해야 한다고 조언한다.

이 때문에 개인정보 보호와 활용이라는 난제를 풀어가기 위해 반드시 알아야 할 용어가 '비식별화'와 재식별화'다.

우선 '비식별화'부터 알아보자. 비식별화는 개인들의 정보 가운데 일부를 삭제하거나 범주화시켜 이 정보만으로 특정 개인을 알아볼 수 없도록 한 것이다.

한국인터넷진흥원(KISA)이 소개한 개인정보 비식별조치 과정과 사후관리 체계.
한국인터넷진흥원(KISA)이 소개한 개인정보 비식별조치 과정과 사후관리 체계.
예를 들어 전우치와 홍길동, 임꺽정 씨의 나이와 집주소, 휴대폰번호와 휴대폰 사용 개월수, 이메일 주소가 개인정보로 수집됐다고 가정하면 이 정보는 개인정보 원본 데이터다. 여기서 개인임을 식별할 수 있는 요소를 제거한다.
이름과 휴대폰번호, 이메일을 삭제하면 되는 것이다. 이제 나이와 집주소, 휴대폰 사용 개월수만 남았다. 여기에 범주화가 이뤄진다. 나이는 21~30세, 31~40세, 51~60세 등으로 범주화시킨다.

사용개월수 역시 3~4개월, 7~8개월, 13~14개월 등으로 범주화한다. 집주소는 범주화를 위해 부분삭제 조치한다. 구체적인 집주소는 삭제하고 서울시, 전라남도 등 시, 도만 남겨두는 것이다.

이같은 조치가 이뤄지면 서울시에 사는 21~30세인 사람이 여러명이 될 수 있다. 최소 2명 이상이 같은 범주에 묶이게 되면 누가 홍길동이고 누가 임꺽정인지 알 수 없게 되는 것이다. 이렇게 비식별화된 개인정보를 기업들이 마케팅 등에 사용할 수 있도록 하자는 것이 전문가들의 조언이다.

그런데 여기서 '재식별화'가 다시 화두가 된다.

이런 비식별화된 개인정보가 여러개 모이면 다시 개인을 알아 볼 수 있지 않겠느냐는 것이다. '재식별화'는 비식별화된 정보들을 모아서 다시 개인을 특정할 수 있는 정보로 만드는 것을 뜻한다.

예를 들면 비식별화된 A통신사의 고객정보와 B증권사 고객정보, C 쇼핑몰의 개인정보를 대조하면 개인을 알아 볼 수 있을수도 있다는 것이다. 실제로 지난해 국정감사에서 정의당 추혜선 의원이 재식별화 우려를 지적하기도 했다.

특히 지금은 재식별화가 이뤄졌을 경우 재식별화한 기업에 책임을 묻는 것이 아니라 비식별화를 제대로 하지 않았다는 이유로 비식별화를 한 기업에 책임을 묻고 있다.
이에 대해 전문가들은 비식별화의 기준을 법으로 정의하고, 비식별화된 정보를 모아 재식별화한 기업에 대해선 천문학적인 과징금 등을 부과하는 방향으로 개인정보보호 제도가 개선되야 한다고 입을 모으고 있다.

이민화 창조경제연구회 이사장은 "비식별화 중심의 규제를 재식별화 규제로 패러다임을 전환해야 한다"고 조언했다.
최병철 스마트구루 대표도 "비식별화된 정보를 재식별화하는 기업은 그 업종에서 완전히 퇴출시킬 수 있는 제재를 가해야 개인정보를 제대로 활용할 수 있다"고 강조했다.

jjoony@fnnews.com 허준 기자

fnSurvey