금융 AI 데이터 라이브러리 구축, 첫 삽 떴다
금융위원회가 추진 중인 금융 인공지능(AI) 데이터 라이브러리 시스템 구축 사업이 본격 착수 준비에 돌입했다. 당초 금융위는 올 7월 금융 AI 데이터 라이브러리를 운영할 계획이었으나 예정보다 지연됐다.
20일 관련 업계에 따르면, 한국신용정보원은 금융 AI 데이터 라이브러리 시스템 구축 사업을 위한 우선협상대상자를 선정했다. 기술능력평가 80%, 입찰가격평가 20%를 기준으로 심사해 우선협상대상자를 선정했다.
한국신용정보원은 가능한 이번 달 안으로 정식 계약을 체결할 계획이다. 한국신용정보원은 계약일로부터 7개월 이내에 시스템을 구축하는 것을 목표로 한다. 이렇게 되면 내년 상반기 금융 AI 데이터 라이브러리 시스템이 구축 완료될 것으로 보인다.
금융 AI 데이터 라이브러리는 가명정보의 재사용을 허용하는 데이터 인프라다. 앞서 2020년 신용정보법 개정을 통해 가명정보와 데이터(가명정보) 결합 제도가 도입됐다. 가명정보는 특정 개인을 알아볼 수 없도록 처리한 정보로 통계작성, 연구, 공익적 기록보존을 위해 정보주체의 동의없이 가명정보를 이용할 수 있다.
금융사, 핀테크 기업, 통신사, 신용정보회사, 데이터 전문기업 등 총 32개 기업과 기관이 참여하기로 했다. 향후 참여 기업은 더 늘어날 수 있다.
한국신용정보원은 해당 시스템 구축과 관련해 6가지 주요 사업을 선정했다. 먼저 데이터 저장소를 구축하고, 데이터 저장소 할당 등 관리 기능을 구현한다.
두 번째로 이용자 홈페이지를 구축한다. 이때 대용량 파일 송수신 기능이 구현돼야 한다. 업무 포털을 구축하고, 파일 반출입 웹 시스템을 구축한다.
한국신용정보원은 데이터전문기관 결합 데이터베이스(DB) 서버를 교체한다. 서버 간 파일 전송, DB 적재 추출 기능을 구현한다. 데이터전문기관은 기업간 가명정보 결합을 지원하는 기관을 말한다.
또 라이브러리 시스템, 데이터전문기관 시스템의 개인정보 흐름 분석자료를 제공할 수 있도록 시스템을 마련할 계획이다.
금융 AI 데이터 라이브러리는 금융당국에서 주요하게 추진 중인 사업 중 하나다. 지난 5월 한국신용정보원이 주최한 금융산업 AI 대응전략 세미나에서 김주현 금융위원장은 “양질의 빅데이터 확보를 위한 금융 AI 데이터 라이브러리 구축, AI 신기술 활용 활성화 등을 위한 금융 데이터 규제개선, 금융분야 AI 신뢰 제고를 위한 금융 AI 테스트베드 구축 등을 추진하겠다”고 밝힌 바 있다.
금융 AI 데이터 라이브러리 시스템 구축에 대한 논의가 시작된 계기는 금융권의 활용 기술이 고도화되면서다. AI 학습, 혁신적 서비스 개발, 신용평가 및 리스크 관리 고도화 등을 위해서는 데이터 결합이 필수적이다.
그러나 현행 신용정보법과 금융 분야 가명익명처리 안내서에 따르면, 데이터전문기관은 데이터 결합을 수행한 후 결합 전후 데이터를 즉시 파기해야 한다. 데이터 이용기관도 데이터 이용목적 달성 후 결합 후 데이터를 파기해야 한다. 따라서 중소 핀테크나 금융사는 대량, 양질의 데이터셋을 구축하고 이용하는데 어려움을 겪고 있다.
구체적으로, 데이터전문기관은 동일한 데이터를 여러 번 결합해 사용할 경우 데이터 보유기관으로부터 매번 데이터를 전송받아 결합해야 한다. 데이터 이용기관은 데이터 결합 신청 시 밝힌 이용목적을 위해서만 해당 데이터를 사용할 수 있어, 이미 확보한 데이터를 새로운 이용목적으로 이용할 경우 다시 데이터 결합을 신청해야 하는 번거로움이 잇따른다.
쉽게 말해, 데이터전문기관이 A+B, A+C, A+D를 수행하려는 경우에도 A를 저장할 수 없어 데이터 보유기관에게 매번 A를 전송받아야 한다.
금융위는 “불필요한 데이터 결합에 과도한 시간과 비용이 소요되고 있으며, 데이터 결합 신청부터 최종 데이터 결합, 제공까지 평균 약 2개월이 소요된다”며 “운영비, 인건비 등의 중복이 발생하며 반복적인 데이터 송수신에 따른 정보유출 등 보안위험의 발생도 증가할 수 있다”고 우려했다.
이에 금융위는 금융 AI 데이터 라이브러리를 혁신금융서비스로 지정해 테스트를 해볼 계획이다. 데이터 재사용을 전면 허용할 경우 재식별 우려 등 개인정보보호 문제가 초래될 수 있어 혁신금융서비스로 시범적으로 운영해보겠다는 취지다. 이에 금융위는 데이터 보호체계를 갖춘 신용정보원, 금융보안원이 데이터를 저장, 관리하고 데이터를 재사용할 경우 적정성 평가를 거치도록 할 계획이다.
한편, 금융위는 AI 데이터 라이브러리를 통해 금융 AI의 성능이 고도화될 것으로 기대하고 있다. 금융위 측은 “중소 핀테크, 금융회사 등이 안전한 가명정보의 재사용을 통해 데이터 결합에 소요되는 시간과 비용 등을 절약하고 금융권이 데이터를 적시성 있게 활용할 수 있을 것으로 기대된다”고 밝혔다.
글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network