정부의 ‘디지털 뉴딜’ 대표과제인 ‘데이터 댐’ 사업이 본격 시작된다. 과학기술정보통신부는 ‘데이터 댐’ 프로젝트의 7대 핵심 사업을 수행할 주요기업 등의 선정 작업을 마무리하고, 사업을 본격 추진한다고 2일 밝혔다.

이번 사업에는 민간기업을 중심으로 관계부처와 공공기관 총 4739개가 참가, 역대 최대 규모 지원 아래 최종 2103개 기관이 첫 지원대상으로 확정됐다.

이번에 추진되는 7대 핵심 사업은 ▲AI 학습용 데이터 구축 ▲AI 바우처와 ▲AI데이터 가공바우처 사업 ▲AI융합 프로젝트(AI+X) ▲클라우드 플래그십 프로젝트 ▲클라우드 이용바우처 사업 ▲빅데이터 플랫폼 및 센터 구축이다. 일자리 창출과 경기부양 효과는 물론 미래를 위한 투자와 각 분야의 혁신을 동시에 추진하기 위해서 기획된 사업들이다.

데이터 댐 7개 사업 연계 구성도

강도현 과학기술정보통신부 인공지능기반정책관은 이날 온라인 브리핑을 통해 “정부는 일자리 창출 그리고 미래투자, 그러면서도 AI 클라우드 빅데이터를 통한 각 분야 확산을 동시에 추진코자 데이터 댐의 개념으로 7개 사업을 진행해왔다”고 말했다.

강 정책관은 “그 결과 역대 최대 규모의 참여 속에서 평가를 거친 총 2100여 개 지원대상기관이 확정됐다”면서 “일부 사업의 경우 추가 지원여력도 남아있어 총 2300개 정도의 지원효과를 갖고 있다고 판단하고 있다”고 해 향후 지원대상 확대 계획을 시사했다.

10대 분야 150종 데이터 대상 AI 학습용 데이터 구축

데이터 댐의 가장 기초이자 핵심 사업인 ‘AI 학습용 데이터 구축 사업(2925억원 규모)’은 AI 서비스 개발에 필수적인 AI 학습용 데이터를 대규모로 구축·개방하는 사업이다. 대량의 데이터 수집에서부터 가공·정제·품질검증까지 많은 일자리가 창출될 것으로 예상되고 있다.

시장수요가 높은 과제를 발굴하기 위해 민간수요(720개), 공공수요(531개), 해외 공개데이터(321개) 등 총 1250개 후보과제를 발굴했다. 삼성·LG전자 등 제조사, SKT·LGU+·KT 등 통신사, 네이버·카카오 등의 포털사를 비롯해 데이터를 활용하는 기업 평가와 전문가로 구성된 과제기획위원회 검증을 통해 10대 분야 총 150종의 데이터셋을 선정해 구축키로 했다. 그리고 유사 데이터의 경우에는 그 품질과 업무의 효율성을 위해서 그룹화시켜 최종 72개 그룹과제를 도출했다.

선정결과는 총 1920개 기업과 기관이 신청해 평균 약 4.2 대 1의 경쟁률을 보였고, 이 중에서 총 584개 기업과 기관(주관기관 72개, 참여기관 512개)이 72개 과제에 참여키로 확정했다.

주요 AI 개발 전문기업, 국내의 크라우드소싱 기업 등은 물론 서울대학교, 한국과학기술연구원(KAIST) 등 37개 대학산학협력단과 서울대병원, 국립암센터 등 21개 주요병원 등 분야별 전문기업·기관이 대거 참여해 데이터셋 구축에 함께 하기로 했다. 한국어 말뭉치, 농작물 병해충 이미지, 암질환 영상 등 텍스트는 7억건, 음성은 6만시간, 이미지는 6000만 건, 영상 1만 5000시간 등 대규모 데이터를 구축한다.

강 정책관은 “국내 AI 산업의 획기적인 도약을 기대하고 있다. 물론 일자리 창출 효과를 위해서도 적극 노력해나가겠다”고 기대를 나타냈다.

추경으로 560억 규모로 확대된 AI 바우처 사업

AI 바우처 사업은 다양한 분야의 중소·벤처기업들이 자사 제품이나 서비스에 AI를 도입해 생산성 향상과 기업 경쟁력을 제고할 수 있도록 지원한다. 기업당 최대 3억원 규모에 달한다.

AI 기술이 필요한 기업이 AI 솔루션·서비스를 제공하는 기업의 제품을 바우처를 통해 구매할 수 있게 하는 사업이다. 수요기업은 단기간 내 최적의 AI를 도입할 수 있게 되고, AI 솔루션이나 서비스를 개발하는 중소기업에게는 새로운 시장 창출의 기회가 생길 수 있다.

이 사업은 올해 처음 시작된 사업으로 당초 예산 39억원이 반영돼 있었으나 하반기 추경사업에서 560억원으로 대폭 확대됐다. 예산 확대로 추가모집을 진행해 총 475개 과제에 733개 기업이 지원해 24 대 1의 경쟁률을 보였다.

서류평가와 온라인 발표를 거쳐 반도체에서 개발부터 창업, 치매예측, 투자분석, 수어번역, 법률, 대기오염 측정, 그리고 언론사까지 총 17개 분야에서 최종적으로 209개(209개 수요기업, 155개 공급기업)의 과제가 선정이 됐다.

섬유 등 전통 분야를 비롯해서 다양한 분야의 기업들이 AI를 적용할 수 있게 됐다. AI를 도입할 필요가 있는 중소기업에는 기업끼리 상호 간의 맞춤형 기술을 공급해 디지털 전환을 촉진하고, AI 솔루션·서비스 개발기업들한테는 초기시장을 지원하는 역할을 해 초기 성장에 도움을 줄 것으로 기대된다.

620건 AI데이터 가공바우처 지원사업 선정…1인기업·소상공인 비중 늘어

AI데이터 가공바우처 지원사업은 중소기업과 스타트업 등이 보유한 데이터를 AI 학습용 데이터로 전환시켜 혁신적인 AI서비스 개발을 지원하는 사업으로, AI 학습용 데이터가 필요한 수요기업들이 바우처를 신청하면 원하는 공급기업으로부터 가공서비스를 제공받도록 지원한다. 공급기업과 수요기업을 연계해 AI 데이터를 가공할 때 일정한 비용을 지급하는 사업이다.

지난해에 비해 올해 AI데이터 가공바우처 신청기업 수가 크게 증가했다.

이번 추경사업에 신청된 총 1152개의 과제 중 최종 620개가 지원 적격 수요기업으로 선정됐다. 올해 선정된 기업에는 예비창업자, 1인 창조기업, 소상공인의 비중이 많이 늘어났다. 데이터 활용이 곧 소규모 사업체까지 확산되고, 데이터 기반의 창업이 활성화되고 있는 것으로 나타났다는 분석이다.

국민 체감효과 큰 8개 분야 AI+X 프로젝트 추진

282억원 규모 AI 융합 프로젝트(AI+X)는 각 분야에서 수집·축적된 데이터의 안전한 학습과 AI 개발 및 활용을 지원하는 사업이다. AI 기업에는 알고리즘을 고도화하고 초기사업 기회를 제공하는 한편, AI를 활용한 각 분야의 혁신이 촉진될 것으로 정부는 기대하고 있다.

올해 의료·국방·에너지·시설물 관리 등 경제적 파급효과가 국민 체감효과가 큰 8개 분야의 프로젝트가 추진된다. 군 의료 지원, 감염병 대응, 해안경계, 산단 에너지 효율화, 불법 복제품 판독, 지역 특화산업 혁신, 국민안전 확보, 지하공동구 관리 분야다.

이번 추경 사업에서는 데이터를 제공하고 현장에서 활용할 기관과 AI를 개발할 기업을 우선 공모선정했다. 평균 3.8 대 1, 최대 14 대 1의 경쟁률을 기록했다. 국내 AI 기업들의 보다 많은 데이터 학습과 AI 개발기회를 제공하는 다수 프로젝트에서 경쟁형 방식을 도입했고, 총 16개의 컨소시엄이 선정됐다.

물류, 헬스케어, 교육, 비대면 복지 등 클라우드 플래그십 프로젝트 추진

250억원 규모 클라우드 플래그십 프로젝트는 클라우드 산업 발전전략의 핵심과제 가운데 하나로, 비즈니스의 연속성 보장과 경쟁력 확보가 필요한 산업 분야를 선정해 클라우드 서비스 통합 플랫폼과 서비스 개발을 지원한다. 클라우드 인프라 기업을 중심으로 다수의 클라우드 서비스 기업들이 연계해 세계적 수준의 클라우드 서비스 협력·개발에 도전해보고자 하는 사업이다.

올해에는 5개 분야의 과제 공모에서 헬스케어, 교육 분야를 비롯해 제조와 물류, 비대면 복지 산업 분야를 우선 지원하고, 2024년까지 매년 신규로 산업분야 5개를 지정해 지원한다.

중소기업벤처부와 협업해 추진하는 제조 플랫폼(IaaS)을 제외한 4개 플랫폼 개발 과제와 63개의 서비스(SaaS) 개발과제를 확정했다. 플랫폼 개발에 KT, NBP, NHN 등 국내 주요 클라우드 기업이 함께 참여하고 있고, 서비스(SaaS) 개발은 중소기업이 주도한다.

클라우드 이용 지원 대상 기업 1차 337개 선정, 연내 600여곳까지 확대

80억원 규모의 클라우드 이용 바우처 사업은 클라우드 산업 발전전략 핵심과제로, 기존의 클라우드 이용료 지원 사업인 중소기업 클라우드 서비스 적용 확산 사업을 확대 개편했다. 국내 중소기업의 업무환경을 클라우드 기반으로 디지털 전환하여 기업의 경영환경 개선과 비대면 상황에서의 업무 연속성 내재화를 위해 컨설팅·전환비용·이용료를 종합적으로 지원한다.

기존에 기업당 300만원을 지원했던 사업으로, 이를 2000만원으로 늘려 다양한 클라우드 솔루션을 도입하도록 지원하고자 했다.

이번 공모에서는 458개 기업이 신청했다. 그 중 1차 지원 대상으로 337개 기업을 선정했다. 순차적으로 컨설팅을 거쳐 클라우드로 전환과 이용을 지원한다. 1차 선정 기업에는 클라우드 기반 업무환경에 익숙하지 않은 제조업 73개(21.1%), 도매 및 소매업 50개(14.5%), 보건·사회복지업 15개(4.3%) 등도 포함돼 있어, 산업 전분야로 클라우드가 확산되는 기반 사업의 역할을 할 것으로 기대된다. 아울러 9월 중에 수요기업을 추가로 선정해, 연내 총 600개 이상 기업을 지원할 계획이다.

연내 5개 빅데이터 플랫폼 신규 구축, 곧 선정 예정

추경에서 405억원을 투입해 핵심분야의 데이터를 수집·분석·유통하는 5개 플랫폼과 50개 센터를 추가 구축하는 이 사업 과제는 아직 평가결과 검토 작업이 진행 중이다. 지난 7월 공모를 통해 14개 컨소시엄이 신청해 2.8 대 1의 경쟁률을 보였다.

강 정책관은 “현재 과제 조정과정에 있다. 면밀한 사업분석을 통해 평가된 기업·기관들에 대해서 세부적인 평가내용과 적정성을 정리한 이후 선정할 것”이라고 설명했다.

이 사업은 공공과 민간이 협업하여 활용도 높은 양질의 데이터를 생산·개방하여 국내 데이터 생태계를 혁신하고 기업의 경쟁력을 향상시킬 수 있는 데이터 댐의 핵심 사업 중 하나이다.

5개 빅데이터 플랫폼이 올해 새로 구축되면 작년에 마련된 10개(금융, 환경, 문화, 교통, 헬스케어, 유통, 통신, 중소기업, 지역경제, 산림) 플랫폼과 합쳐 데이터 댐에 양질의 데이터 공급이 지속적으로 확대될 것이란 기대가 나온다. 또한 정부는 지난 3월 개시한 통합 데이터 지도(www.bigdata-map.kr)와 연계해 국민들이 유용한 데이터를 쉽게 검색·활용할 수 있도록 정보를 제공할 계획이다.

데이터 표준화·품질관리, AI 법제도 개선 등 후속계획 추진

정부는 향후 후속계획도 내놨다. 먼저 데이터 간 상호호환성 확보를 위해 데이터 표준화를 추진한다.

우선 현재 개발·보완(8월말)된 ‘데이터 구축 공통 가이드라인’을 추경사업에 적용하고, 자율주행, 의료 등 주요산업별 ‘AI 학습용 데이터 표준안’을 개발해 관계부처 협의를 거쳐 핵심분야를 국내표준화한다. 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다.

양질의 데이터를 구축하기 위해 품질관리 가이드라인 적용, 정량적 품질평가지표 도입, 활용기업이 참여하는 품질평가자문단 운영, 품질평가 전문조직 활용(정보통신기술진흥협회) 등 품질관리 체계를 대폭 강화한다.

대량의 데이터를 구축하는 사업의 특성상, 구축단계에서 완벽한 품질검증이 어려운 구조적 한계를 고려해 기 존에 구축된 데이터(2017~2019)를 포함해 품질평가 등을 통해 지속 보완·유지보수해 나갈 계획이다.

한편, 정부는 민간 클라우드를 포함한 디지털서비스의 공공부문 조달이 용이하도록 ‘사업공고-입찰-계약’ 방식에서 ‘서비스 검색-이용’ 방식으로 계약제도를 개선하는 ‘디지털서비스 전문계약제도’를 올 10월 중 시행할 예정이다.

또한 과기정통부에 ‘디지털서비스 전문위원회’를 신설해 수요기관이 전문계약 트랙에 따라 계약·이용할 수 있는 디지털서비스를 선정하고, 선정한 디지털서비스 등록부터 계약까지의 전과정을 지원할 수 있도록 전문 유통플랫폼을 구축·운영할 계획이다.

아울러 AI로 인한 경제·사회 전반의 패러다임 변화에 대응하고자 규제개선 사항을 종합해 오는 11월 목표로 AI분야 법제도 개선 로드맵을 제시할 방침이다.

오는 12월 AI시대의 기본법제인 지능정보화 기본법이 시행됨에 따라 하위법령도 완비하고 주요국, 국제기구 등의 AI 윤리규범을 비교 분석해 우리나라 AI 윤리 기준도 정립할 예정이다.

최기영 과기정통부 장관은 “우선, 짧은 기간에도 불구하고 데이터 댐 관련 추경사업에 대한 민간기업과 대학, 지자체 등의 높은 관심과 참여에 감사한다”며 “정부의 노력뿐만 아니라 민간의 투자와 참여가 무엇보다 중요한 만큼 법·제도적 인프라 구축도 병행함과 동시에, 디지털뉴딜반 운영을 통해 관계부처 등과도 긴밀히 협력해 데이터 댐 관련 프로젝트의 차질없는 시행에 만전을 기할 것”이라고 밝혔다.

글. 바이라인네트워크
<이유지 기자>yjlee@byline.network


--------------------------------------------------
[무료 웨비나] 통합 분석을 통한 효율적인 IT 운영·정보관리 방안
  • 일시 : 2020년 12월 3일 14시~15시
등록하러 가기