카카오브레인의 인공지능 기술, 현재와 미래

인공지능은 카카오에도 미래 먹거리다. 이 목표에는 여러 자회사 중 카카오브레인이 도전한다. 수장은 1988년생 개발자 김일두 대표다. 올해 카카오브레인은 의미 있는 발표를 하기도 했다. 지난달에는 한국어로 된 초거대 언어모델 ‘KoGPT’를 공개하고, 앞으로 3년간 “인공지능에 기억력을 심는 도전을 한다”는 비전을 제시하기도 했다. [관련기사: 카카오 “지난일 기억하는 인공지능 만든다”]

무엇보다 흥미로운 것은, 카카오브레인이 계속해 대중에게 말을 걸기 시작했다는 점이다. 자신들이 어떤 작업을 하고 있는지, 그리고 그 작업이 어떤 결과를 가져올 것인지를 설득하려 한다. 20일, 김일두 카카오브레인 대표가 온라인으로 기자들과 만나 여러 질문에 답한 것도 그런 이유로 읽힌다.

이날 김일두 대표가 공개한 것은 현재 인공지능의 수준과 앞으로 카카오브레인이 하려는 일이다. 다음은 주요 설명 내용이다.

[무료 웨비나] 아이덴티티 보안 없는 보안 전략은 더 이상 안전할 수 없습니다

◎ 일시 : 2025년 7월 15일 (화) 14:00 ~ 15:30
◎ 장소 : https://bylineplus.com/archives/webinar/53537

현재의 인공지능 수준

현재의 인공지능 산업은 머신러닝이 잘 작동되고 있는 수준이다. 머신러닝이란 데이터를 많이 주고 그 데이터 안에서 일정 패턴을 찾아 기계가 스스로 학습하게 하는 것이다.

현재 머신러닝의 수준은 어디까지 왔을까? ‘인식-추론-기억’ 의 단계 중 인식과, 경우의 수가 아주 많은 문제를 잘 풀어내는 영역까지 왔다.

인식은 쉽게 말하면, 강아지와 고양이 사진을 각 10만장씩 주고 두 개체의 특성을 학습한 후 무작위로 주어지는 이미지에서 두 동물을 판별해내는 영역을 말한다.

최근에는 영상의료가 이 부분에 해당한다. 환자와 정상인의 사진을 왕창 주고 암인지 아닌지 구분해낸다거나 단백질의 패턴 인식을 하는 것들이 잘 되어 있다. 자율주행 사례에서도 차와 주변에 있는 물체를 인식하는 것도 여기에 들어간다.

경우의 수가 많은 문제를 푸는 것과 관련해서 대표적으로 사람들이 알고 있는 케이스가 알파고다. 이런 수준의 연구들이 진행되고 있는데, 단백질의 3D 구조를 예측하는 것도 아주 많은 경우의 수가 있다. 인공지능을 통해 그 경우의 수를 줄이고 그 안에서 연구진이 탐색할 수 있도록 기술적으로 접근했다고 볼 수 있다.

일부 추론의 영역까지 도전하는 부분도 있다. 카카오브레인은 여기에 집중하고 있다. ‘라지 스케일 AI’에 대해 말하고프다. 지난 11월 공개한 KoGPT는 언어 모델 중에서 국내 최고의 빅모델 중 하나다.

또 이미지 생성 기술도 공개했다. 명령을 내리면 그림을 그리는 AI인데, 기존의 이미지 생성모델보다 수백배 이상 커졌다. 예컨대 ‘종전선언을 했다’는 문장이 주어지면, 그 팩트를 그림으로 표현한 것이 아니라 거기에 담긴 여러 감정이나 한 같은 것을 추상적인 개념으로 표현해냈다고 저희는 판단한다.

‘아보카도 모양의 체어’라는 문장은 기존에 없던 것이다. 인공지능 분야에서 이 그림에 주목할 수 밖에 없는 것은, 기존에 있던 의자 그림을 가져온 것이 아니라 아보카도 모양으로 의자 디자인 콘셉트를 그려냈기 때문이다. 아보카도와 의자의 특성을 이해하고, 아보카도 모양 의자는 이래야 한다고 일부 추론을 해냈다.

미래의 인공지능 수준

향후 2~3년 내지, 길게는 5년 안에 인간의 추론 능력과 유사한 형태의 발전이 인공지능에서 있을 거라고 본다.

내년 초, 언어로 표현된 글과 이미지를 동시에 이해할 수 있는 AI 모델을 공개한다. 이름은 ‘넥스트 이미지넷 프로젝트(NEXT IMAGENET PROJECT)’다. 많은 연구기관과 이 프로젝트를 어떻게 진행할지 논의 중이다.

이미지를 글로 표현하거나 글에 알맞은 이미지를 찾아내거나 이미지 검색을 하거나 등에 쓰일 수 있다. 이미지 검색이라는 챕터를 바꿔버릴 수도 있다. 쇼핑이라든지 카카오에서 이미지를 검색해야 되는 요구들을 많이 해결해 줄 수 있을 걸로 보고 있다.

실제로 세상을 바꾸는 기술로 의미를 가질 수 있도록 도전한다. 구체적으로 정해지진 않았지만 우선적으로 헬스케어와 교육에서 주요한 문제에 도전할 수 있을 거라고 본다.

헬스케어와 관련해 단백질 구조를 풀어내는 문제 등이 여기에 들어갈 수있다. 딥마인드의 알파폴드2라는 모델이 상당히 정확한 수준으로 단백질 구조를 예측해냈는데 내년에는 단백질 구조가 정교화되는 것, 그리고 더 복잡한 단백질까지 예측하는 것이 이루어질 거라고 본다.

향후 1~2년 안에는 아마 단백질 간 상호작용, 즉 여러 물질이 어떤 상호작용을 하는지도 에측하는 모델이 인공지능을 통해 나올 거라고 본다. 이런 분야에서 라지 스케일 AI 역량을 기반으로 도전하려 한다.

다음은 카카오브레인에 향한 몇 가지 질문과 그에 대한 김일두 대표의 답을 정리한 것이다.

Q. 네이버의 초거대 AI 모델과는 어떻게 다른가?

= 실제로 쓸 수 있는 정도로 대규모의 영역에서 타사의 최고 크기 규모 언어 모델과 성능이 비등한 수준으로 만들기 위한 노력을 하고 있다. 일부 태스크에서 카카오브레인(KoGPT)의 성능이 네이버가 공개한 모델의 최고 수준보다 더 높게 나온 결과도 있다. 내년 상반기 중에 그 성능을 더 많이 올리려고 하고 있다.

또 다른 차이는 카카오브레인이 언어 모델만 개발하는 점이 아니라는 것이다. 언어와 이미지를 섞거나, 이미지를 생성해내는 멀티모달(여러 가지 형태와 의미로 컴퓨터와 대화하는 환경)을 선도하고 있다. 국내에서 이런 연구를 하는 팀은 거의 없다.

Q. 파라미터(매개변수, 외부로부터 투입되는 데이터)의 양이 적은 것 아닌가?

= 파라미터가 무조건 많다고 좋은 것은 아니다. 실용 구간을 60억에서 800억 파라미터로 보고 있다. 언어 모델의 규모가 실용 구간을 넘어 커지면 데이터를 다루기 상당히 까다로울뿐더러, 비용과 시간도 많이 든다. 속도도 느려질 수 있다. 현재는 실용적인 구간에 집중한다.

물론 내부에서 더 큰 파라미터 규모를 다루는 것을 하고 있고, 내년에 공개한다. 문자와 이미지를 함께 다루는 모델의 경우에는 글로벌로 제일 큰 모델을 내부에서 학습중이다. 내년 상반기에는 공개할 수 있을 것 같다.

Q. 카카오의 헬스케어 CIC, 혹은 최근 인수한 신약 개발 AI 스타트업 갤럭시 등과 협업은?

=헬스케어CIC와는 협업을 적극 논의 중이다. 구체적 협력안이 아직 나오진 않았으나 내년에는 헬스케어 사업을 진행함에 있어 협력이 될 것 같다고 보여진다.

갤럭시와는 구체적으로 어느 한 질병을 찍어서 간다기 보다는, 일반화된 신약 개발 프로세스를 AI를 통해서 만든다고 보면 된다. 그 안에서 구체적으로 해보란한 몇가지 전략적 부분을 지금 정하고 있다.

Q. 카카오브레인의 연구가 빠른 시일내 사업적으로 현실에 적용될 수 있는 부분은 무엇일까?

= 공동체(그룹사) 내에서 적용할 때 속도감 있게 진행할 수 있을 것 같다. 가령 가장 많이 고민하는 지점이 AI 고객 센터 같은 거다. 카카오브레인이 공개한 언어모델을 기반으로 만든 기술로 일부를 대체할 수 있다. 고객센터에 들어오는 주요 문의사항을 빠르고 정확하게 처리할 수 있을 거라고 본다.

그러한 관점에서 공동체 내에서 중요한 곳이 카카오뱅크다. 은행이라고 하는 자체가 기본적으로 고객 센터의 형태를 갖고 있는데, 이걸 모바일로 다 옮겨놓은 구조이기 때문에 AI 고객 센터가 카카오뱅크에 상당히 중요한 부분을 차지할 것으로 본다. MOU를 맺고 공동연구를 진행하면서 이런 부분을 중요하게 보고 있다. 내년 상반기부터는 구체적 적용 사례가 나올 예정이다.

Q. 이미지와 텍스트를 동시에 이해하도록 하는 모델은 언제쯤?

=도전적이고 선도적인 부분이다. 내년 연구에서 그 포지션을 상당히 가져갈 것이다. 특히 다음검색에서 이미지 검색이나 카카오톡 내에서 이미지 검색, 카카오 내에 있는 다양한 쇼핑, 커머스 서비스에서의 검색 등에 적용할 수 있을 거라고 본다.

Q. 개인 정보 유출이나 혐오 발언 등의 문제 가능성은?

=가장 많이 고민한 부분이다. 그러나 카카오브레인이 공개한 것은 서비스가 아니라 기술이다. 그런 문제들은 기술을 서비스에 녹여 사용하는 측에서 막아줘야 한다고 본다. 세계어느 곳에서도 개인 정보 유출이나 혐오 발언 문제를 100% 막은 곳은 없다. 이 문제를 풀기 위해 초거대언어모델을 공개한 것도 사실이다. 산업계에서 이 문제를 연구하고 싶어 하는데 그간 초거대 모델에 대한 접근이 불가능해 연구가 이뤄지지 못했다.

또 이 문제는 사실 인공지능이 사람과 같은 지능을 갖고 있다고 해도 풀기 어려운 부분이다. 긴 호흡을 갖고 봐야 하는 어려운 문제다. 따라서 카카오브레인의 기술을 상업적으로 쓰려는 이들에게는 카카오브레인에 연락을 해달라고 라이선스에 명시하고 있다. 혹시 있을 유출이나 혐오 문제에 세심하게 주의를 기울이려고 하고 있다.

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network