가명정보 활용 위한 개인정보 가명처리, 정보결합 어떻게 할까

‘데이터 3법(개인정보보호법, 정보통신망법, 신용정보법)’의 국회 통과로 개인정보 보호와 활용이란 상충된 이슈가 다소 해소될 수 있게 됐다.

시민단체는 데이터 3법을 ‘개인정보도둑법’, 이 법이 통과된 날을 ‘정보인권 사망의 날’로까지 규정하며 개인정보 오·남용과 정보주체의 권리 침해 우려를 큰 목소리로 제기하고 있지만, 산업계에서는 환영의 목소리가 나온다.

이번 데이터 3법 통과로 개인정보보호법에 처음으로 개인정보와 익명정보의 중간 개념인 가명정보 개념을 도입했다. 특정 개인을 식별할 수 있는 정보는 개인정보, 식별할 수 없는 것은 익명정보, 그리고 추가 정보 없이는 특정 개인을 식별할 수 없도록 가명처리된 정보가 가명정보다. 이에 따라 법에서 규정하는 개인정보의 개념이 보다 명확해졌다는 게 정부와 국회의 이야기다.

가명정보는 통계작성, 과학적 연구, 공익적 기록 보존 등과 같은 일정한 목적을 위한 처리와 그 정보 결합을 허용했다. 정보주체의 동의 없이 활용이 가능하다.

법에 가명정보를 명시하면서 허용되는 활용 목적과 범위, 그리고 개인정보처리자들이 적용해야 하는 안전조치 방법과 기준 등을 규정했다.

개인정보보호법에 도입된 가명정보 개념과 활용범위

개인정보보호법에 따르면, 가명정보는 가명처리함으로써 원래의 상태로 복원하기 위한 추가정보 사용·결합 없이 특정 개인을 알아볼 수 없는 정보다. 가명정보는 통계작성, 과학적 연구, 공익적 기록보존 등을 위해 정보주체의 동의 없이 가명정보를 처리할 수 있다.

특정 개인을 알아보기 위한 정보를 포함하지 않도록 적절한 조치 하에 제3자 제공은 물론, 지정된 전문기관을 통해 서로 다른 개인정보처리자 간 가명정보 결합도 가능해진다.

개정된 신용정보법에서도 가명정보를 통계 작성(상업적 목적 포함), 연구(산업적 목적 포함), 공익적 기록보존 목적으로 동의없이 활용할 수 있게 허용했다.

가명처리로 인해 활용할 수 있는 데이터의 종류가 다양해지고 새로운 기술·제품·서비스 개발, 시장조사 등 활용 분야도 확대될 수 있다는 기대감이 있다. 또 보안시설을 갖춘 전문기관을 통해 기업 또는 기관 간 데이터 결합이 허용돼 금융, 통신, 유통 등 서로 다른 분야의 데이터가 안전하게 결합·이용될 수 있게 된다. 데이터의 가치가 제고되고, 이를 바탕으로 개인별 맞춤형 서비스 등 혁신 서비스 창출이 활성화될 수 있다.

산업계에서 환영하는 이유이지만 시민단체와 전문가 등 일각에서는 개인정보 침해 우려의 목소리가 높다.

가명정보를 활용하려는 쪽에서도 가명정보와 그 활용 범위, 가명처리 방법, 정보 결합 방법과 절차 등에서 해석을 달리하거나 혼란스러운 지점이 있는 것이 사실이다.

정부가 통과된 데이터 3법 시행에 필요한 하위법령과 행정규칙 개정 등 후속조치를 서두르는 배경, 그리고 서둘러야하는 이유가 여기에 있다.

행정안전부, 방송통신위원회, 금융위원회, 개인정보보호위원회 등 관계부처는 지난 21일 데이터 3법 후속조치 계획으로 내달까지 시행령 개정안을, 3월까지 고시 등 행정규칙 개정안을 모두 마련한다고 밝혔다. 또 의료, 금융 등 정보의 특성을 고려한 분야별 가이드라인과 구체적 사례와 예시를 담은 법령 해설서 개정안도 4월까지 초안을 내고, 법 시행시점에 맞춰 발간한다는 방침이다. <관련기사 – 정부, ‘데이터 3법’ 후속조치 잰걸음…내달 시행령 개정안 마련> 

예를 들어 데이터의 안전한 결합을 위한 구체적인 결합절차는 시행령 개정안에 담겨질 사항이다. 가명정보의 범위도 시행령에 담길 수 있다.

가명처리, 비식별처리 방법은 무엇이 있나 

법에 따르면, 가명처리는 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가 정보가 없이는 특정 개인을 알아볼 수 없도록 처리하는 것을 말한다.

특정 개인을 알아볼 수 없도록 하는 방법은 다양하다. 지난 2016년 7월 정부가 개인정보를 안전하게 활용하는데 도움이 되기 위해 마련, 시행한 ‘개인정보 비식별조치 가이드라인’에 있는 방법들을 참고할 수 있다.

이 가이드라인에는 정보주체인 개인을 알아볼 수 없도록 하는 방법으로 가명처리(Pseudonymization), 총계처리(Aggregation), 식별 데이터 삭제(Data Reduction), 데이터 범주화(Data Suppression), 데이터 마스킹(Data Masking) 방법을 제시했다.

이 가운데 가명처리(Pseudonymization)는 개인 식별이 가능한 데이터를 직접 식별할 수 없는 다른 값으로 대체하는 기법이다. 성명, 그리고 출신학교, 근무처 등과같은 고유의 특징을 대상으로 한다. 데이터의 변형이나 변질 수준이 적지만 대체 값을 부여할 경우 식별이 가능한 고유속성이 계속 유지될 수 있는 장점이 있다.

가명처리 방식으로는 휴리스틱 가명화, 암호화, 교환 방법이 있다.

가명처리를 적용한 예는 이렇다. 특정 개인을 알아볼 수 없는 다른 방식으로 바꾸는 방식이다. 비식별조치 가이드라인에서 제시한 예시에 따르면, 서울에 거주하고 있고 한국대에 재학중인 35세 이유지를 가명처리하면 서울에 거주하고 있고 국제대에 재학중인 30대 홍길동으로 바꿀 수 있다.

휴리스틱 가명화는 식별자에 해당하는 값을 몇가지 규칙으로 대체하거나 사람의 판단에 따라 가공해 자세한 개인정보를 숨긴다. 성명을 몇몇 일반화된 이름으로 대체 표기하거나 소속(직장)명, 주소 등을 화성, 금성 등으로 대체하는 것처럼 사전에 규칙을 정해 수행할 수 있다.

모든 데이터를 동일한 방법으로 가공하기 때문에 사용자가 쉽게 이해해 활용이 가능한 것이 장점이다. 하지만 활용할 수 있는 대체 변수에 한계가 있어 다른 값으로 대체하는 일정한 규칙이 노출되는 취약점이 있을 수 있기 때문에 규칙을 수립할 때 개인을 쉽게 식별할 수 없도록 세심한 고려가 필요하다.

성명, 사용자 아이디(ID), 소속명, 기관번호, 주소, 신용등급, 휴대전화번호, 우편번호, 이메일 주소 등에 적용할 수 있다.

암호화는 정보 가공시 일정한 규칙의 알고리즘을 적용해 암호화함으로써 개인정보를 대체하는 방법으로, 보안성을 강화하기 위해 개인정보 등 중요정보에 널리 쓰이는 기법이다. 통상 다시 복호화가 가능하도록 복호화 키(key)를 가지고 있어 이에 대한 보안방안이 필요하다.

일방향 암호화(one-way encryption 또는 hash)를 사용하는 경우는 이론상 복호화가 원천 불가능하다. 하지만 일방향 암호화는 개인정보의 식별성을 완전히 제거하는 것으로, 양방향 암호화에 비해 더욱 안전하고 효과적인 비식별 기술에 해당된다.

주민등록번호, 여권번호, 의료보험번호, 사용자 아이디(ID), 신용카드번호, 생체정보 등에 적용할 수 있다.

교환은 기존의 데이터베이스의 레코드를 사전에 정해진 외부 변수(항목)값과 연계해 바꾸는 방법이다. 사용자 아이디(ID), 기관 번호, 나이, 성별, 신체정보, 소득, 휴대전화번호, 주소 등에 적용할 수 있다.

가명처리 외에 개인 식별요소를 삭제하는 비식별조치 방법으로는 총계처리, 식별 데이터 삭제, 데이터 범주화, 데이터 마스킹 등이 있다.

총계처리(Aggregation)는 식별자 수치를 통계값(전체 혹은 부분)을 적용해 특정 개인을 식별할 수 없게 하는 방법이다.

데이터 삭제(Data Reduction)는 개인 식별이 가능한 데이터의 전부 혹은 일부를 삭제 처리하는 방법이다.

데이터 범주화(Data Suppression)는 특정 정보를 해당 그룹의 대푯값으로 변환(범주화)하거나 구간값으로 변환해 개인 식별을 방지하는 방법이다.

데이터 마스킹(Data Masking)은 식별자 데이터의 전부 또는 일부분을 대체값으로 변환하는 방법이다. 공백 또는 대체(***, OOO), 잡음(랜덤 노이즈) 추가 등으로 바꿔 처리하는 방법이다.

이 가이드라인에 직접 제시된 가명처리 방법 외에도 데이터 마스킹 등 다양한 방법으로 개인정보를 법에 명시된 가명정보로 만들 수 있을 것으로 보인다.

가명처리-비식별조치, 정보결합 방안 관심 

데이터 3법 통과로 비식별화 솔루션을 제공하는 기업들은 이같은 가명처리 방법을 포함한 비식별화 기술에 관심이 높아질 것으로 예상하며 기대감을 나타내고 있다.

그러나 사실 결과적으로 3년 반 전에 발간한 이 비식별조치 가이드라인은 개인정보 활용 활성화에 큰 기여를 하진 못했었다.

시민단체들은 비식별 조치된 개인정보도 재식별할 수 있는 가능성이 충분하고 비식별 조치된 정보에 대한 투명성이 확보돼 있지 않다는 등 여러 문제점을 지적해 왔다. 심지어 이 가이드라인에 따라 정보집합물 결합서비스를 제공해온 기업들과 한국인터넷진흥원 등 개인정보 비식별조치 전문기관을 고발하기도 했다.

산업계에서도 이 가이드라인은 법적 근거와 구속력이 없는 상황에서는 맘 놓고 활용하기에 부담과 불안감이 있었다. 비식별 처리된 정보는 데이터 활용도와 유용성이 떨어진다고 토로해왔다.

하지만 이같은 문제는 데이터 3법 통과와 그 후속조치로 진행될 정부의 고시, 가이드 개정 등이 나오면서 일정부분 해소될 것으로 기대한다.

데이터 결합 방안과 절차 역시 법 시행령에 구체적으로 담기게 된다. 정부는 데이터 결합이 안전하게 이뤄질 수 있도록 결합키 관리기관과 결합기관을 분리하고, 결합 데이터의 외부 반출시 익명처리를 우선한다는 원칙을 적용할 것을 검토하고 있다.

가명정보를 여러 개 결합할수록 개인 식별 가능성이 커지기 때문에 데이터 결합에 따른 개인정보 유출 침해 위험 방지 방안을 사전에 최대한 마련해둬야 하기 때문이다.

정부는 데이터 3법 후속조치 이행은 관계부처 합동 ‘법제도 개선 작업반’을 통해 추진한다. 행정안전부 전자정부국장을 반장으로 해 관계부처 과장급이 참여한다. 산업계, 시민사회단체, 각계 전문가들과도 소통해 하위법령과 보호정책을 구체화할 계획을 밝혔다.

과학기술정보통신부는 데이터 결합을 통한 새로운 가치의 데이터 생산을 촉진하기 위해 작년에 구축한 10개 빅데이터 플랫폼 간 연계, 데이터 거래 관련 가이드라인과 표준계약서 등을 개발·제공할 예정이다. 또한 안전한 데이터 활용을 뒷받침할 하위법령, 유관법령 등도 조속히 정비하겠다고 밝혔다. 2월 중 데이터경제 활성화를 위한 종합 지원방안을 발표할 예정이다.

금융위원회는 금융분야 데이터 거래소를 구축해 3월부터 시범 운영할 방침을 내놓기도 했다. 금융분야 데이터 거래소는 데이터 수요자와 공급자를 매칭해 금융·통신·기업정보 등의 데이터를 거래할 수 있는 중개 플랫폼이라는 게 금융위의 설명이다. 데이터 결합을 위한 데이터 거래가 가능하다. 이 데이터 거래소는 데이터 검색, 계약, 결제, 분석 등 데이터 유통의 전 과정을 원스톱으로 지원한다. 수요자와 공급자는 별도 연락수단 등을 활용하지 않고도 거래소 시스템 내에서 모든 거래 절차를 진행할 수 있다. 이 거래소는 안전한 익명정보와 가명정보 거래를 위해 금융보안원이 운영할 예정이다.

글. 바이라인네트워크
<이유지 기자>ylee@byline.network

관련 글

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다