오픈소스로 AI 모델 공개한 메타, 안전한가?

오픈AI, 구글, 마이크로소프트 등이 초거대언어모델(LLM) 기반의 AI 분야에서 앞서 나가고 있는 동안 페이스북과 인스타그램의 주인인 ‘메타’는 사람들의 뇌리에서 조금씩 잊혀 가고 있었다. 이 회사는 ‘메타버스’에 올인을 선언하고 그 방향으로 열심히 달려왔는데, 메타버스가 조금씩 테크 업계에서 “아웃 오브 안중”이 되어가고 있다. 메타의 마크 저커버그 CEO는 어쩌면 ‘이 산이 아닌가 봐’라고 생각하고 있을지도 모른다.

하지만 메타는 AI 분야에서 의외로 적지 않은 영향력을 발휘하고 있다. 메타가 개발해서 오픈소스로 공개한 초거대 언어모델 라마(LLaMa) 덕분이다. 오픈AI나 구글의 LLM은 그 안을 들여다볼 수 없지만, 오픈소스인 라마는 개발자들이 마음껏 가지고 놀 수 있다. 덕분에 라마를 기반으로 변형된 다양한 LLM들이 쏟아져 나오기도 했다. 특히 개발자들은 스마트폰과 같은 모바일 기기에서도 이용할 수 있는 소형화된 LLM을 만드는 놀이를 즐겼다.

이 가운데 메타는 18일 ‘라마2(LLaMa2)’를 발표했다. 이번에도 역시 오픈소스여서, 많은 개발자들이 라마2를 가지고 다양한 시도를 해볼 수 있을 것으로 보인다.

라마2의 가장 큰 강점은 ‘개방성’과 ‘소형화’다. 오픈소스로 누구나, 심지어 상업용으로도 이용할 수 있도록 했으며, 70억, 130억, 700억 개의 파라미터로 사전 학습됐다. GPT3의 경우 1750억개의 파라미터였다는 점을 상기하면 상대적으로 작은 규모이다. GPT4는 오픈AI가 파라미터 수를 공개하지 않았다.

이를 통해 메타는 LLM 분야의 두 가지 문제를 해결했다. 빅테크 기업의 전유물이었던 LLM을 오픈소스 정책으로 누구나 접근할 수 있도록 했으며, 너무 커서 엄두조차 내지 못했던 LLM의 규모를 작게 만들어 일반 개발자도 이것저것 시도해 볼 수 있도록 했다. 규모가 작아졌다는 것은 클라우드에만 존재할 수 있었던 LLM을 PC나 스마트폰과 같은 디바이스에서도 이용할 수 있게 했다는 의미이기도 하다.

메타는 라마2를 발표하며 개방성을 자랑하듯 다양한 파트너십도 공개했다.

“오늘 메타와 마이크로소프트는 애저 클라우드와 윈도우에서 라마2에 대한 지원을 발표했습니다. 라마2는 개발자와 조직이 생성형 AI 기반 도구와 경험을 구축할 수 있도록 설계되었습니다. 메타와와 마이크로소프트는 AI의 이점을 대중화하기 위한 노력을 공유하고 있으며, 메타가 개방적인 접근 방식을 취하게 되어 기쁘게 생각합니다.”

마이크로소프트

“퀄컴은 2024년부터 플래그십 스마트폰과 PC에서 라마2 기반의 AI를 제공할 예정이며, 이를 통해 개발자들이 스냅드래곤 플랫폼의 AI 기능을 사용하여 새롭고 흥미로운 생성형 AI 애플리케이션을 개발할 수 있도록 지원할 계획입니다.”

퀄컴

마크 저커버그 CEO는 페이스북을 통해 “오픈소스는 더 많은 개발자가 새로운 기술로 구축할 수 있도록 지원하므로 혁신을 촉진하고, 더 많은 사람들이 소프트웨어를 면밀히 검토하여 잠재적인 문제를 파악하고 수정할 수 있기 때문에 안전과 보안이 향상된다”고 개방형 AI의 장점을 소개했다.

인터넷에 연결되지 않아도 AI를 이용할 수 있다는 것은 보안 측면에서 유리한 요소가 될 수 있고, 클라우드에서 의존적이지 않다는 것은 비용부담이 줄어든다는 의미가 되기도 한다.

그러나 이 같은 방식에 대한 우려도 있다. LLM이 워낙 강력한 힘을 가지고 있어 악인의 손에 LLM 들어갔을 때 어떤 일이 벌어질지 알 수 없다는 두려움이 있다. 예를 들어 누구나 핵무기를 만들 수 있다고 하면 이 세상은 어떻게 될까? 일각에서는 AI가 인류를 멸망시킬 힘을 가지고 있다는 주장도 있다. 오픈AI는 처음에 오픈소스 정책을 취하다가 이를 취소한 바 있다. 많은 이들의 비난에 오픈AI의 대답은 “AI는 너무 파워풀해서 책임있는 회사에서 관리해야 한다”는 것이었다.

악시오스에 따르면, AI를 이용한 생물학적 테러가 가능하다고 한다. 누군가 코로나19와 같은 바이러스를 인위적으로 만들어서 세상에 뿌린다면 어떻게 될까?

그러나 메타 측은 이런 우려가 지나치게 과장됐다고 말했다. 닉 클레그 메타의 글로벌 이슈 부분 대표는 “(라마2를) 다운로드한 모든 용도를 예측할 수는 없다”면서도 “(라마2)는 생각보다 멍청한 그저 텍스트 예측 패턴 인식 시스템일 뿐”이라고 말했다.

다음 단어를 예측하는 역할이 전부인 LLM이 인류를 파괴한다거나 핵무기급 파괴력을 지녔다는 것은 과장이라는 것이다.

클레그 대표는 메타가 모든 것을 오픈소스로 할 계획은 아니라고 설명했다. 경우에 따라서는 폐쇄형 모델도 만들 것이라고 그는 덧붙였다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다