‘AI 세계대전’ 한국도 뛰어들었다
[생성 AI가 가져올 변화]
현재 주요 국가들 사이에선 총성 없는 전쟁이 펼쳐지고 있다. 이른바 ‘인공지능(AI) 세계대전’이다. 미국이 빅테크 주도로 앞서나가는 가운데 중국과 유럽, 일본, 한국이 바짝 따라붙었다. 한국은 미국과 AI 기술 격차가 1.5년으로 알려졌다.
주요 기술 기업 간 AI 경쟁은 이제 사생결단 수준으로 달아올랐다. 지난해 11월, 마이크로소프트 등이 투자자로 참여한 연구기업 오픈AI가 초거대 언어모델 GPT-3.5 기반의 ‘챗(Chat)GPT’를 공개한 이후 분위기가 사뭇 달라졌다. 충격적인 성능 때문이다.
챗GPT는 간단한 프로그램 코딩부터 보고서 요약은 물론 에세이까지도 수 초 만에 척척 써내면서 시장을 놀라게 했다. 미국 경영전문대학원(MBA)·변호사·의사 시험도 통과할만한 성적을 받아내기도 했다. 네이처 제출 논문엔 챗GPT가 공동 저자로 이름을 올렸다. 이후 네이처는 학계 우려를 반영해 “대화형 AI를 논문 저자로 인정하지 않는다”는 방침을 밝혔다. 최근 두 달여 사이에 벌어진 일들이다.
국내에서도 인터넷 플랫폼과 통신, 가전 등 업종을 막론하고 주요 기업들이 AI 기술 경쟁에 뛰어들었다. 네이버, 카카오, KT, LG 전략을 짚어본다.
‘뉴클라우드’ 네이버, AI 수직계열화 구축
네이버는 ‘뉴클라우드’ 전략을 내세웠다. 지난해 클라우드 중심으로 여러 사업 조직을 통합했다. 기술 역량을 집결해 AI 기술 중심의 인프라 고도화를 추진한다. 매출 확대를 위한 선택이기도 하다.
이를 위해 ▲AI 반도체(삼성전자와 협력) ▲초거대 모델(하이퍼클로바) ▲클라우드 ▲검색과 쇼핑, 클로바 등 서비스 프로덕트로 이어지는 AI 영역 전반에서 수직계열화를 구축한다.
성낙호 네이버클라우드 이사는 “하이퍼클로바, GPT-3와 같은 대규모 언어모델을 대중적 서비스에 적용할 수 있을 정도로 효율적으로 운용하기 위해서는 클라우드 기술과의 결합이 필수적”이라며 “AI뿐만 아니라 앞선 클라우드 기술까지 갖춘 기업이 향후 초거대 AI 기반 서비스 경쟁을 이끌어갈 것”이라고 의지를 보였다.
네이버 초대규모 AI는 ‘하이퍼클로바’다. 국내 기업 중 최초로 공개했다. 자체 보유한 슈퍼컴퓨터와 네이버 생태계에 있는 방대한 데이터를 활용했다. AI 매개변수(파라미터)는 2040억개다. 한국어 데이터 학습량은 GPT-3의 6500배 이상. 한국어 기준으로 가장 강력한 AI로 자리매김했다.
현재 하이퍼클로바는 네이버의 상당수 서비스에 녹아들었다. 주요 서비스 중 하나가 ‘클로바노트’다. 음성인식 정확도가 크게 높아졌고, 대화 주제별로 구간을 나누고 핵심까지 자동 요약해준다. 쇼핑에선 ‘클로바 MD’가 활약 중이다. 쇼핑 기획전 자동 생성 AI로 하이퍼클로바가 탑재돼 기획전 주제 선정부터 제목 작성, 상품 선택까지 거의 모든 과정을 자동 수행한다. 검색 분야엔 ‘지식인터랙티브’가 있다. 일상 용어로 질문해도 AI가 이를 이해하고, 전문 정보를 찾아준다. 대화형 검색이 가능하다. 긴 구어체를 이해하고 음성 인식 오류 감소시키는 등 음성 검색도 고도화했다.
성낙호 이사는 “네이버는 AI 반도체, 초거대 모델, 클라우드, 서비스 프러덕트로 이어지는 초거대 AI 서비스의 버티컬 영역 전반에 대한 완성형 기술력을 갖춰가고 있고, 이와 같은 기술 포트폴리오를 갖춘 기업은 글로벌에서도 흔치 않은 만큼, 네이버는 클라우드 기반 AI 서비스로 글로벌 시장에서도 우수한 경쟁력을 발휘해나갈 것”이라고 방침을 전했다.
카카오, ‘코GPT-i머신러닝’으로 업무 혁신
카카오의 초거대 AI는 ‘코(ko)GPT’다. 카카오브레인이 개발했다. 데이터와 인프라, 모델 개발, 서비스 출시 전체를 아우르는 포괄적인 기술 경쟁력을 갖췄다는 게 회사 설명이다.
코GPT는 2021년 11월 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개한 GPT-3의 한국어 특화 AI 언어모델이다. 60억개 매개변수(파라미터)와 2000억개 토큰(token)의 한국어 데이터를 학습해 한국어를 사전적 문맥적으로 이해한다. 주어진 문장의 긍정과 부정 판단, 긴 문장 한 줄 요약, 문장을 추론해 결론 예측, 질문을 하면 문맥을 이해해 답변하는 등 언어를 가지고 활용할 수 있는 과제를 수행한다.
작년 10월엔 개발자 전용 사이트인 카카오디벨로퍼스에 코GPT 오픈 API(앱개발환경)를 공개했다. 이용자는 월 200건까지 무료로 이용할 수 있다. 맥락과 의도에 따라 문장을 생성해 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.
카카오는 코GPT API를 활용해 향후 다양한 상품 후기를 보유한 서비스 플랫폼사나 광고회사 등을 대상으로 파트너십 체결을 하고 서비스 적용 범위를 확대해 나갈 예정이다. 영어 및 일본어 모델을 준비해 오픈소스화하고, 베트남어, 말레이시아어 등 동남아어 버전으로도 확장 개발한다.
카카오엔터프라이즈는 지난 30일, ‘카카오i머신러닝(Kakao i Machine Learning)’을 출시했다. 쉬운 AI 개발을 돕는 머신러닝 플랫폼으로 어려운 인프라 지식이나 모델 운영 노하우없이도 AI 모델 학습부터 추론, 배포까지 프로세스 전반을 통합 관리할 수 있다. 시스템 개발과 서비스 운영을 통합해 안정적이면서 신속한 개발 환경을 제공한다.
개발자들은 개인 작업공간을 원하는 만큼 생성하고 필요한 자원을 할당받아 사용할 수 있다. 각자 역할에 따라 권한도 부여 가능하다. 자신의 워크스페이스에 동료를 초대해 결과물을 공유하고 협업도 할 수 있다.
최동진 카카오엔터프라이즈 AI 총괄(CAIO)은 ”챗GPT, 생성형 AI와 같은 대규모 컴퓨팅 자원을 요구하는 고성능 분산 학습 환경까지 지원해 새로운 가치를 창출하는 데 기여할 것”이라고 전했다.
KT, ‘AI 풀스택’ 강자 거듭나
KT는 작년 11월부터 ▲AI 인프라 혁신 ▲초거대 AI 상용화 ▲AI 미래인재 양성 등 AI 발전전략을 본격 추진하고 있다. 이른바 ‘AI 풀스택(Full-Stack) 완성’을 노린다. AI 풀스택은 AI 인프라와 하드웨어, 소프트웨어 등 기술을 통합해 패키지로 제공하는 것을 의미한다.
회사는 지난해 리벨리온(AI반도체 설계)에 300억원, 모레(AI 인프라 솔루션) 등에 전략 투자했으며, AI 원팀을 통해 KAIST, 한양대, ETRI 등과 최신 AI 알고리즘을 연구 중이다. KT는 올해 안에 기존 대비 3배 이상 효율을 갖춘 한국형 AI 반도체의 풀스택을 완성한다는 목표다.
KT클라우드와 리벨리온, 모레는 KT를 통해 동남아시아 데이터센터 시장 진출에 나서기로 했다. 리벨리온은 AI 반도체 설계를 맡는다. 오는 3월 언어모델을 지원하는 서버용 AI 반도체를 선보일 예정이다. 이 반도체는 모레의 인프라 솔루션과 결합해 KT 데이터센터에 탑재된다. 세 회사는 협업의 성과물인 AI 풀스택을 가지고 데이터센터를 보유한 동남아 지역 통신사업자를 공략한다는 그림을 그리고 있다.
KT는 초거대 AI를 통해 AI컨택센터(AICC) 서비스 혁신도 추진한다. 작년 12월 기업 대상으로 클라우드 AICC ‘KT A’Cen Cloud(에이센 클라우드)’를 출시했다. 에이센 클라우드는 클라우드 위에 통신인프라, 상담 앱 그리고 AI 솔루션까지 통합 제공하는 서비스형소프트웨어(SaaS) 방식의 AICC 서비스로 만들어진 것이 특징이다. 회사 측은 “기업 고객이 사용하는 솔루션을 클라우드에서 서로 연결한 ‘에이센 생태계’를 구축해 고객에게는 편리함을, 솔루션 사업자에게는 새로운 수익창출의 기회로 만들어 나가고자 한다”라고 설명했다.
KT의 초거대 AI는 ‘믿음’이다. 인간과 공감하는 AI를 목표한다. 상황에 맞춰 말투나 목소리를 바꾸는 것도 가능하며 이전에 나누었던 대화를 기억해 활용하는 등 ‘사람에 더 가까운 대화’를 지향한다. KT는 이러한 특징을 활용한 서비스로 AI 전문상담, AI 감성케어 등을 연내 선보일 예정이다.
AI 전문상담은 단순 문의 응대에 그치지 않고 전문 영역에 대한 방대한 지식을 학습하고, AI 형상화(Embodied AI) 및 개인화 TTS(Text to Speech) 기술로 상담하는 것을 목표한다. 앞서 지니TV의 음성대화 기능을 사용해 AI 오은영 박사와 상담할 수 있는 ‘오은영 AI 육아상담 서비스’를 시연했다. KT는 이러한 초거대 AI를 활용한 서비스를 지속적으로 선보일 예정이다. 이를 통해 산업의 각종 문제 해결은 물론 생활의 디지털 감성까지 끌어올린다는 목표다.
LG ‘엑사원’, 경량화에 의료·제조까지 섭렵
LG AI연구원은 초거대 AI ‘엑사원(EXAONE)’ 공개 1년 만인 2022년 12월 ‘AI 경량화·최적화’ 신기술을 적용한 초거대 언어모델을 선보였다. 앞서 공개한 엑사원 대비 그래픽처리장치(GPU) 사용량은 63% 줄이면서도 AI 개발 속도를 좌우하는 추론(Inference) 속도는 40% 더 빠르고, 정확도는 글로벌 최고 성능을 의미하는 ‘SOTA(State-of-the-art)’ 이상으로 개선한 모델을 개발했다.
LG는 엑사원에 대해 말뭉치 6000억개 이상과 언어와 이미지가 결합된 고해상도 이미지 3억5000만장 이상의 데이터를 학습했고, IT는 물론 금융, 의료 제조, 통신 등 다양한 분야의 산업 데이터까지 학습 중으로 다른 초거대 AI 모델들이 가지지 못한 차별화된 경쟁력을 가진 점을 앞세웠다.
이러한 엑사원 기반 3대 플랫폼이 ▲유니버스(언어) ▲아틀리에(창작) ▲디스커버리(난제)다.
‘엑사원 유니버스(Universe)’는 고객 대상 언어 전문가 AI를 편하게 기획하고 개발할 수 있도록 한 플랫폼이다. ▲고객 상담과 은행 업무 처리를 위해 개발한 AI 은행원(우리은행) ▲지능형 고객 응대 서비스인 AI 컨택 센터(AICC, AI Contact Center)(LG생활건강) ▲어플리케이션에 관한 고객들의 리뷰에 빠르게 대응하기 위해 개발한 앱스토어 고객 리뷰 분석(LG유플러스) 등이 대표적인 예다.
‘엑사원 아틀리에(Atelier)’는 텍스트와 이미지간 양방향 생성이 가능한 엑사원만의 멀티모달 특성을 살린 디자인 생성 플랫폼이다. LG AI연구원은 세계 3대 디자인스쿨 파슨스, 글로벌 크리에이티브 플랫폼 기업인 셔터스톡과 생성 AI 기술을 공동 연구하고 있으며 향후 협업 대상과 영역을 확대할 계획이다.
‘엑사원 디스커버리(Discovery)’는 논문이나 특허 등 전문 문헌의 텍스트뿐만 아니라 수식과 표, 이미지까지 스스로 학습해 데이터베이스화하는 기술을 적용한 플랫폼이다. LG AI연구원은 학습 데이터가 축적될수록 신약과 신소재 개발 범위와 속도에 혁신을 가져올 것으로 보고 있다. 지난해 미국에서 진행한 세계적 AI 학회인 ‘뉴립스(NeurIPS)’에서 화학 구조식을 데이터베이스화하는 기술이 기존 모델 대비 100배 이상 성능을 내는 성과를 발표했다.
LG AI연구원은 ▲개인 맞춤형 항암 백신 신항원 ▲차세대 배터리인 리튬황 배터리 전해질 ▲차세대 OLED 고효율 발광 재료를 발굴하는 AI 모델을 선보이는 등 산업 난제 해결을 위한 AI 기술 개발에 박차를 가한다.
LG전자는 주 단위로 국가별, 지역별 제품 판매 수요를 예측하는 데 AI 기술을 적용하기 시작했으며, LG이노텍은 카메라 렌즈와 센서의 중심을 맞추는 공정에 AI 기술을 도입해 최적화 기간을 50% 이상 단축하는 등 효율성과 생산성을 높이는 데 AI 기술을 활용하고 있다.
글. 바이라인네트워크
<이대호 기자>ldhdd@byline.network
[무료 웨비나] API연결만으로 가능한 빠르고 쉬운 웹3 서비스 구축
- 내용 : API 연결을 통해 웹2와 웹3를 끊김 없이 연결하는 최신 융합 기술과 이를 통한 적용 사례를 다룹니다.
- 일시 : 2024년 10월 10일 (목) 14:00 ~ 15:10
소프트웨어에서 세계대전이 벌어지고 있으면 총알을 만드는 공장은 절대 망할수가 없을텐데, 각 기업의 개발환경이 구글 TPU인지 엔비디아 GPU인지, CUDA를 쓰는지 OpenCL을 쓰는지가 더 궁금하네요.
이 하드웨어 아키텍쳐 공급자들이 AI전쟁의 무기상인이니까요.