구글 새로운 AI 모델 출시되자…“역시 구글”

“제미나이 어이가 없음. GPT-4 이후로 오랜만에 할 말을 잃었음. 요즘 스타트업 혹한기 때문에 우리 회사 걱정으로 가득한데, 회사 걱정 따위 너무 작게 느껴짐. 아… 대한민국, 아… 인류… ㅠㅠ.”

AI 스타트업 <보이저엑스> 남세동 대표

#gemini 가 연내 세상에 모습을 드러냈네요. mmlu 사람전문가 점수를 처음으로 깨고 90점 달성했는데요. 그 외에 멀티모달 태스크에서도 GPT4-V 수치를 모두 앞질렀다고. 유투브의 위력이 여기서 드러나는 것 같습니다.

<네이버클라우드> 하정우 AI 이노베이션 센터장

구글의 반격이 시작. Gemini 유튜브 깜짝 발표를 보고 나니 역시 저력이 어디 가지는 않는구나 싶다.

K2G 테크펀드 정지훈 제너럴 파트너

구글이 새롭게 발표한 대규모언어모델(LLM)을 접한 국내 AI 전문가들이 소셜미디어에 남긴 첫 평가다.

구글은 6일(현지시간) AI의 기반이 되는 LLM ‘제미나이'(Gemini)를 공개했다. 오픈AI의 GPT4를 능가한다는 평가가 나온다. 챗GPT 등장 이후 구글은 브레인, 딥마인드 등 내부의 AI 조직을 통합해 제미나이를 개발해왔다.

제미나이의 가장 큰 특징은 멀티모달 기반 AI 모델이라는 점이다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 데이터를 입력받고 출력할 수 있다. 회사 측에 따르면, 구글은 제미나이를 개발 단계 초기부터 모달리티로 사전 학습시켰다. 회사 측은 ‘네이티브 멀티모달’이라고 소개했다.

회사 측은 “제미나이는 처음부터 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있으며, 기존 멀티모달 모델보다 훨씬 뛰어나며 거의 모든 영역에서 가장 앞선 성능을 보였다”고 자평했다.

제미나이는 아래와 같은 세 가지 버전으로 선보였다.

제미나이 울트라(Gemini Ultra): 매우 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델

제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델

제미나이 나노(Gemini Nano): 온 디바이스 작업에 가장 효율적인 모델

구글이 공개한 자료에 따르면, 제미나이 울트라의 성능은 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 보였다. 수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding; 대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록한 제미나이 울트라는 전문가 인력보다 높은 결과를 기록한 최초의 모델이다.

또 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 최상위 점수를 획득했다.

일반 이용자들은 파인튜닝된 제미나이 프로가 적용된 AI 챗봇 ‘바드’를 한국을 포함한 170개 이상의 지역에서 영어로 이용할 수 있다. 또한 구글 스마트폰 픽셀(Pixel)에도 제미나이가 탑재될 예정이다. 픽셀 8 프로 모델은 제미나이 나노가 실행되도록 설계된 최초의 스마트폰이다. 픽셀에 탑재될 제미나이 나노는 녹음 앱의 요약하기와 같은 새로운 기능을 지원하며, 왓츠앱(WhatsApp)을 시작으로 내년에 더 많은 메시징 앱에 적용될 예정이다.

순다르 피차이 구글 CEO는 “버전인 제미나이 1.0은 울트라(Ultra), 프로(Pro), 나노(Nano) 등 다양한 규모에 맞게 최적화되었다”면서 “제미나이 시대의 첫 번째 모델이자, 올해 초 구글 딥마인드를 설립하며 구글이 품었던 비전이 처음으로 실현된 것과도 같다”고 평했다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다