“AI에는 국수주의가 필요하다”

최근 국내 IT 업계에서 ‘AI 주권’이라는 단어가 자주 언급된다. 앞으로 AI 기술이 우리 사회와 경제에 엄청난 영향력을 발휘할 것이기에, AI 기술력을 국내에서 보유하고 자체적인 생태계도 갖출 수 있어야 한다는 목소리다.

모바일 플랫폼을 구글과 애플에 내준 이후 모든 생태계가 그들에게 끌려 다녔던 경험이 이런 목소리의 뒤에 있다. 예를 들어 애플과 구글이 앱마켓 수수료 정책을 바꾸면 국내 CP 업체들이 휘청거렸다. 정부와 국회가 규제를 만들어도 플랫폼 독점력을 이겨내지는 못했다.

31일 서울 여의도 국회 의원회관에서는 윤영찬·변재일 의원실이 주최한 ‘초거대AI 시대의 대한민국 그리고 AI 주권’ 토론회가 열렸다. 이 자리에는 초거대 AI모델(LLM)을 만들고 있는 국내 업체 5개사와 학계 전문가들이 참석해 AI 주권의 필요성을 역설했다. 참석자들은 글로벌 기업에 AI 주도권을 내주면 사회 경제적으로 위험하다고 한목소리를 냈다. 심지어 “AI에는 국수주의가 필요하다”는 주장까지 나왔다. 이날 발제자, 토론자의 이야기를 요약해봤다.


윤영찬 의원 : AI는 우리 사회의 미래를 어떤 방향으로든 끌고 가는 굉장히 중요한 요소가 될 것이다. 제일 궁금했던 부분은 한국 기업들은 과연 어디까지 기술적인 진화가 이루어지고 있고 우리 초거대 AI의 서비스들은 언제쯤 출시가 될 것인지다. 그리고 이것이 함의하는 바는 무엇인지에 대해서 한번 듣고 싶다.

이와 관련해서 여러 가지 점검해야 될 문제가 있다고 생각한다.

  1. 우리나라가 가지고 있는 기술은 어떤 것인가, 그 진화의 정도는 어디까지인가.
  2. 우리가 경쟁력을 잃었을 때 데이터를 중심으로 한 기술적인 종속은 오지 않을까.
  3. 우리 스타트업들은 어떤 AI 모델과 협업해서 본인들의 서비스를 만들어 갈 것인가.
  4. 인공지능에 대한 규제 법안에 대한 점검도 필요하다.
  5. 노동이나 교육 등 우리 사회가 변화하게 될 모습들에 대한 점검도 필요하다.

변재일 의원 : 초거대 AI가 주권이라는 개념 없이 이루어진다면, 그들이 제공한 정보에 대해 우리는 실체적 진실을 모르고 진실인 것처럼 느낄 수밖에 없고 우리의 모습도 그들에 의해서 세계로 전달될 수 있다.

지금 글로벌 선도 AI 개발자들이 규제를 먼저 요청하고 있다. 그들이 개발자로서 AI에 대한 공포감을 먼저 느꼈기 때문에 규제를 요청하는 것인가, 아니면 후발주자들의 추격을 막기 위해서 선발주자들이 규제의 벽을 세우는 것인가 생각을 해볼 필요가 있다. 또 AI 시대에 대한민국이, 인류가 나아가야 할 방향은 무엇인가에 대해 성찰해보는 자리가 됐으면 좋겠다.

하정우 네이버클라우드 AI 이노베이션 센터장 : 최근 챗GPT 플러그인 생태계가 만들어지고 있다. 대화형 서비스 인터랙션을 제공하는 초거대 AI와 사용자의 상호작용을 통해서 모든 앱들을 실행을 할 수 있게 된다. 초거대 AI 기업으로 모든 데이터가 저장이 된다는 얘기다. 이는 데이터 주권의 문제로 이어진다. 우리는 앱 통행세 문제로 많은 개발자들이 고생한 적이 있다. 또 구글 드라이브가 가격 정책을 임의대로 바꾸면서 대학에서 큰 혼란이 있었다. 기술 종속이 가져오는 문제를 확인할 수 있었다.

골드만삭스 리포트에 따르면 생성 AI가 글로벌 GDP 증가에 차지하는 비중이 무려 7%에 달한다고 한다. 영국 정부가 AI 개발에 10억 파운드를 계획하자, (반대당인) 노동당이 그걸로는 부족하다며 110억 파운드를 투자하라고 요구했다. 영국도 초거대 AI 기술확보가 중요하다고 선언을 한 것이다.

우리나라는 사실상 세계에서 유일하게 구글에게 잠식당하지 않은 자체 검색 엔진 보유국이다. 그렇게 버텨준 덕분에 검색을 기반으로 한 플랫폼에서 굉장히 양질의 데이터가 쌓일 수 있었다. 현재 AI 생태계가 만들어진 나라는 한국, 미국, 중국 세 나라뿐이다.

초거대 AI는 모든 언어에 평등하지 않다. (글로벌 AI도) 공개된 데이터를 학습하면 한국어 자체는 굉장히 잘 쓸 수 있다. 하지만 한국의 문화와 법, 제도, 가치관 등 디테일까지 잘 이해하는 것은 전혀 다른 문제다. 우리나라 기업들은 자체 보유하고 있는 양질의 한국어 데이터를 통해서 한국에 대한 상세한 부분을 잘 커버를 할 수 있다.

물론 (국내 기업이) 능력이 있어야 한다. 안 좋은 물건을 쓰라는 말씀은 아니다. 네이버 초거대 AI를 도입한 후 현대백화점은 10일이 걸리던 업무를 세 시간으로 단축했다. 공공부문 특화 초거대 AI도 준비 중이다. 이를 통해 공무원들은 업의 본질에 충실할 수 있고 사회 문제 해결의 도구로도 쓸 수 있으며 민원인들을 훨씬 더 잘 대응할 수 있게 되면서 국가 경쟁력 자체가 향상될 수 있다.

규제도 물론 중요하다. AI 안전 문제가 요즘 많이 대두되고 있다. 하지만 미국이 AI 안전 문제를 얘기하면서도 바꾸지 않는 전제는 “우리가 세계 1등이어야 된다”라는 부분이다. 그래서 법제화는 신중해야 한다.

김경훈 카카오 AI 정책지원 이사 : 카카오는 대한민국의 AI 주권 확보를 위해 개방형 생태계를 만들고 있다. 소프트웨어부터 시작해서 이제 AI 오픈 커뮤니티를 만들기 위해 노력해왔고, 언어나 이미지 데이터셋도 만들어서 개방했다. 대한민국의 AI 주권을 성장시킬 수 있는 그런 기반을 만들었다. AI 기술도 중요하고 산업도 중요하지만 책임감 있는 AI 실현을 하는 노력이 굉장히 중요하다. 카카오에는 책임감 있는 AI를 만들기 위한 담당 조직이 있다.

AI 주권을 위해서는 민간의 경쟁력이 중요하고, 그걸 위한 인프라 지원이 첫번째로 필요하다. (정부가) 슈퍼 컴퓨팅 인프라나 학습에 필요한 것들을 지원해 주는 방향이다. 또 민간이 접근하기 어려운 공공 데이터를 좀더 개방이 됐으면 하는 바람이다. AI는 굉장히 빠르게 흐름이 바뀌고 있는데 기존의 R&D 체계는 유연성을 발휘하기 어렵다. 이런 유연성을 확보하기 위해서 1년 단위로 예산을 책정해서 그 안에서 과제를 자유롭게 선정하고 개발할 수 있는 프로그램형 R&D 로 전환하는 움직임이 필요할 것 같다.

성석함 SK텔레콤 정책협력 담당 부사장 : 정부와 기업 간의 긴밀한 협력을 통해 해결해야 할 문제가 많다. SK텔레콤은 제도적으로 지원해 줬으면 하는 도메인을 두 가지 정도 생각을 하고 있다.

첫 번째는 AI 반도체다. 엔비디아 주가가 하루에 25% 올랐다. AI를 처리해야 될 반도체 수요는 높아지고 있는 상황이다. 이미 반도체는 주권이나 안보 차원까지 확대돼 있다. SK텔레콤이 사피온이라는 AI 반도체 회사를 자회사로 두고 있는데 아무리 대기업이라도 육성하는 데 어려움이 있다. 사피온뿐 아니라 국산 AI 반도체 기업이 많은데, 이런 기업들의 초기 수요를 창출하고 경험을 쌓을 수 있도록 정부의 적극적인 예산 지원이라든지, 프로젝트 발굴 지원 등이 있으면 좋겠다.

두 번째는 특화 모델 개발이다. 챗GPT는 전문 분야에서 활용하기에는 신뢰도나 보안 면에서 어렵다. 분야별 특화 모델에 대한 정부의 지원이 필요하다.

세 번째는 AI 규제가 정비됐으면 한다. 규제가 지나치게 선제적으로 강화되지는 않았으면 좋겠다. 아울러 이런 규제는 민관이 협력해서 만들어 나갔으면 좋겠다.

이진형 KT 사업담당 상무 : 페이스북과 인스타그램, 구글 검색, AWS 클라우드, 넷플릭스, 구글 플레이. 이런 이름만 들어도 국내에서 어떤 일이 벌어지고 있는지 알 것이다. 앞에서 이야기 나왔듯 챗GPT 플러그인 생태계가 지금까지 모든 서비스 시장에서 일어났던 것처럼 동일하게 장식을 할 것 같다.

그래도 정부가 국내 서비스로 생태계가 활성화 될 수 있도록, 국내에 있는 플러그인은 국내 AI 파운데이션 모델을 쓸 수 있게끔 제도를 만들고 예산을 투입해주면 어떨까 한다. 또 정부가 과감하게 국내 기업을 키울 수 있게, 국내 회사들이 한글 데이터를 활성화할 수 있도록 예산을 많이 집행하는 게 중요하지 않나 한다.

데이터 보안도 중요한데 해외 클라우드로의 데이터 유출 가능성을 줄이기 위해 최소한 공공부문이나 B2B 서비스에 대해서는 법률상으로 데이터들이 해외에 넘어가지 않도록 할 필요가 있다.

저작권 문제의 경우 당연히 저작권을 보호해야 하지만, 너무 클레임이 걸리게 되면 산업의 발전 속도에 제약이 걸릴 수 있다. 저작권은 양날의 검인데 국내 회사와 글로벌 회사가 같은 수준의 규제가 적용돼야 한다. 그래야 불합리한 상태에서 경쟁이 이뤄지지 않는다.

김유철 LG AI 연구원 부문장 : 과거와 현재 AI의 가장 큰 차이점은 글로벌 AI 선도 기업들이 높은 한국어 역량을 바탕으로 국내 시장에 빠르게 진출할 수 있다는 점이다. 한국이 강점을 가지려면 성능뿐 아니라 사실에 기반한 결과물, 저작권, 저작권에 영향이 없는 결과물, 최적화를 통한 경제성 실현 등 기술적 차별화로 경쟁력을 확보해야 한다. 특히 미국, 중국에 대비해 산업별로 특화된 사례를 만들어내는 것이 이런 차별적 파급력, 경제적 측면에서 유리할 것이다. 제조, 화학, 의료 등 여러 부문에서 AI 활용사례를 만들어나가는 것이 중요하다.

LG AI 연구원은 2020년 12월에 설립된 LG 그룹 싱크탱크다. 2021년 5월 초거대 AI 개발을 선언하고 2021년 12월부터 엑사원을 공개할 시점부터 이와 같은 전략적 방향성을 주장해 왔다.

국가 차원에서는 이미 많은 정책들로 다양한 지원들이 이루어지고 있다. 조금만 더해보자면 최근 학습 데이터와 평가 데이터를 확보하는 과제가 진행되고 있는데, 평가 데이터가 신뢰성, 윤리성 관련된 데이터 중심으로 되고 있다. 실제 다양한 전문 분야에 대해서 최고 성능을 어떻게 보여줄 수 있을지 평가하는 방향성에 대해서도 같이 준비가 됐으면 좋겠다.

현재 국회나 정부에서도 논의되는 다양한 규제에 대해서 실증적으로 검증을 해봐야 된다. AI로 인해 발생할 수 있는 문제들을 사전에 대응하기 위해서 법적 정책적 조치를 순차적으로 마련하고 실행함으로써 기술뿐만 아니라 규제에서도 국제적인 우수 사례들을 만들어갈 수 있다고 생각한다.

김진우 카이스트 기술경영학부 교수(좌장) : 국내 기업들의 전략 자체가 조금 바뀌어야 할 것 같다. 적지 않은 리소스가 한국 밖에 있다. 글로벌 기업들은 자국 예산만 가지고 하는 것이 아니다. 중국 자본으로도 한다. 글로벌 네트워크을 펼쳐가는 게 해당 국가의 펀딩을 받아서 하겠다는 것이다. 미국 정부 펀드 중에도 일부는 해외 공동 연구 하는데 쓰라고 나오는 어마어마한 규모의 펀드가 있다. 한국어에 너무 집중하는 것보다 거대 시장을 보고 진출한 전략이 필요할 것 같다.

김정환 부경대 휴먼 ICT 융합전공 교수 : 데이터 관련된 얘기를 좀 하고 싶다. 생성형 AI가 성장할수록 데이터 확보나 데이터 거래에 대한 이슈들이 계속 더 중요해질 것이다. 그런데 공공 데이터가 형편없다. 양적인 성과 지표에 너무 치중을 한다. 데이터 품질이 훨씬 더 중요하게 다뤄져야 될 것 같다. KPI를 품질 쪽으로 관심이 옮겨져야 한다고 생각한다. 그리고 데이터 소유권이나 데이터 거래 활성화 같은 정책이나 가이드라인이 필요하다.

AI 영역에서는 국수주의가 일정 부분 필요하다고 생각한다. 우리에게 대안이 있다는 게 사실은 굉장히 행복한 일이다. 코로나 이슈 때 네이버나 카카오 같은 기업들이 없었으면 우리가 마스크나 백신 재고를 실시간 알 수 있었을까? 구글이 잘 서포트해줬을까? 그런 맥락에서 우리가 플랫폼을 갖고 있다는 메리트를 최대한 잘 활용해야 된다고 생각한다.

그런 맥락에서 지금은 핀셋 규제 얘기를 하기보다는 핀셋 지원 정책이 필요한 시점이다.

김창현 성균관대 인공지능융합학부 교수 : 우리가 포털 시대에도 빼앗기지 않았던 시장 지배력을 초거대 AI 시대에서도 유지해 나가는 것이 굉장히 중요하다. 객관적으로 봤을 때 한국 주요 대학의 AI 연구력은 결코 부족하다고 보기는 어렵다. 하지만 앞으로는 AI와 메인 영역의 결합이 많으면 좋겠다. 수학, 언어학, 생리학 등 학문과의 협업이 대단히 중요하다. AI 알고리즘 개발하는 것에 대한 지원도 중요하지만, ‘AI + X’ AI와 국민과 결합을 촉진하는 학문에 대한 지원도 중요하다.

기업이 학교의 연구자를 기업 내로 수렴해서 만드는 공동 연구실이나, 교내 연구자가 만든 AI 모델을 바탕으로 창업하는 연구실 창업을 지원하는 것도 필요하겠다.

김현경 서울과기대 IT정책전문대학원 교수 : 국회 역할이 매우 중요하다. 우리나라 국회는 굉장히 빠르다. 유럽에서 뭘 하면 바로 가져와서 하려고 한다. 토론 몇 번 하고 바로 입법 추진한다. 유럽은 데이터산업의 중요성을 1900년대부터 인식하고 있었다. 2000년대 초반 데이터베이스 지침을 만들었다. 미국은 달랐다. 많은 사람이 다양하게 이용하도록 했다. 20년이 지난 후 데이터와 관련된 인공지능과 관련된 산업과 이런 것들을 봤을 때 미국이 훨씬 더 우세하다.

유럽은 저작물에 대해서도 굉장히 강력한 보호조치를 했고, 미국은 공정이용처럼 사회적 이익이 크면 누구나 자유롭게 이용할 수 있게 했다. 데이터 산업의 우위를 어느 나라가 차지하고 있는가.

우리는 어떤 스탠스를 취하고 있을까. 굉장히 유럽적 스탠스를 취한 것 같으면서도 또 미국에서 뭔가 새 제도가 나온다 그러면 한번 도입해볼까 생각한다. 우리나라의 상황에 대한 면밀한 분석 없이 외국 것만 벤치마킹하는 비전략적인 스탠스가 아니었나라고 생각한다.

제가 개인정보보호법학회 회장을 맡고 있지만 공개된 개인정보가 특정인을 식별할 목적이 아니라면 얼마든지 크롤링해서 사용해도 된다고 생각한다.

엄열 과기부 인공지능기반정책관 국장 : 오늘 말씀을 들어보니 초대에 관련된 생산량의 시장도 우리 사업자들이 다 준비를 하고 계신 것 같다. AI 주권을 확보할 수 있는 측면에서 정부의 역할을 다하겠다는 말씀을 드리겠다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다