AI 특화 파운데이션 모델, 목표는 세계 최고 수준 달성

구글 딥마인드가 만든 단백질 구조를 예측하는 전문적인 인공지능(AI) 모델인 ‘알파폴드’처럼, 우리나라도 특정 분야에서 경쟁력을 갖춘 파운데이션 모델 확보에 나선다. 정부는 법률이나 금융 등 전문 분야에서 세계 최고 수준의 특화 파운데이션 모델 개발을 위해, 엔비디아 그래픽처리장치(GPU) B200을 총 512장 규모로 지원한다.

과학기술정보통신부(과기정통부)와 정보통신산업진흥원(NIPA)은 15일 서울 양재 엘타워에서 ‘인공지능 특화 파운데이션 모델 프로젝트’ 사업 설명회를 열고, “해당 프로젝트 목표는 글로벌 AI 모델 수준 대비 95% 성능 구현이 아닌, 세계 최고 수준의 모델 개발”이라고 밝혔다.

최근 본격적으로 착수한 ‘독자 AI 파운데이션 모델 프로젝트’는 글로벌 AI 모델 대비 95% 이상을 목표로, 최대 3년간 GPU 및 데이터, 인재 등을 종합 지원하는 프로젝트다. 세계적인 경쟁력을 갖춘 범용 AI 모델을 확보하는 독자 AI 파운데이션 모델 프로젝트와 함께, 정부는 지난 5일부터 ‘인공지능 특화 파운데이션 모델 프로젝트’ 공모를 시작했다. 이번 프로젝트는 우리나라가 강점을 가진 특정 분야에 적용할 수 있는 특화 파운데이션 모델과 서비스를 개발해 글로벌 시장을 선점하는 것을 목표로 한다.

장기철 과기정통부 인터넷진흥과 과장은 “독자 AI 파운데이션 모델 프로젝트가 메타의 라마나 오픈AI의 챗GPT 등 모두의 AI에 기반이 되는 모델을 개발한다면, 구글 알파폴드 같은 특화 파운데이션 모델 분야에서는 우리나라가 세계 최고가 될 수 있다”며 특화 AI 모델 시장의 중요성을 짚었다.

독자 AI 파운데이션 모델 프로젝트와 달리 참여팀은 자유롭게 달성 목표를 설정할 수 있다. 세계 최고 수준을 지향하기 때문에, 도전적인 목표를 제시하는 것이 유리하다. 참여팀은 특정 분야와 달성하고자 하는 벤치마크 성능, 서비스 분야 및 개수 등을 제안할 수 있다. 장기철 과기정통부 과장은 “글로벌 AI 모델 수준 대비 성능을 100%나 110% 등 구현할 수 있다고 제안하면 당연히 선정될 가능성이 높다”고 강조했다.

15일 서울 양재 엘타워에서 열린 ‘인공지능 특화 파운데이션 모델 프로젝트’ 사업 설명회에서 발표하는 장기철 과기정통부 인터넷진흥과 과장 (사진=바이라인네트워크)

AI 특화 파운데이션 모델 프로젝트는 3대 지향점 ▲독자 특화 파운데이션 모델 개발에 필요한 GPU 공급으로 다양한 도전 및 시도 ▲오픈소스화를 통해 국내 AI 생태계 확장 ▲산업계 엔지니어링 역량과 학연의 연구 역량 교류로 산학연 역량 레벨업 등으로 두고 있다.

지원 자격은 국내 AI 기업, 대학, 연구기관 등이다. 단독 또는 컨소시엄 형태로 지원할 수 있다. 기존 독자 AI 파운데이션 모델 사업에 선정된 5개 정예팀의 주관기관은 참여할 수 없다. 대기업은 주관기관이 아닌 참여기관으로만 참여할 수 있다. 학계 참여를 높이기 위해 대학은 주관 또는 참여기관으로 필수적으로 참여해야 한다. 해외 기업은 글로벌 서비스 개발에 한해서만 참여할 수 있다.

AI 특화 파운데이션 모델 프로젝트는 GPU만 지원하며, 지원 규모는 엔비디아 GPU B200 총 512장이다. 총 2개 과제를 진행하며, 과제당 256장을 지원한다.

1차에서 총 2개팀을 선정한 뒤, 5개월 후 단계 평가를 진행한다. 2단계 지원은 목표 달성 여부 등을 평가해 지원 여부를 결정한다. 따라서 단계 목표를 달성한 참여팀에게만 약 5개월 동안 GPU를 추가로 지원하는 방식이다. 사업기간은 올해 11월부터 2단계 지원을 포함하면 내년 9월까지로, 약 10개월이다.

독자 AI 파운데이션 모델 사업이 서바이벌처럼 한 팀씩 탈락하는 구조라면, AI 특화 파운데이션 모델은 경쟁 대신 단계평가에서 탈락할 수 있다. 자체적으로 제시한 목표를 달성하지 못하면 2단계 지원을 받을 수 없다. 최종평가 이후에는 정부 구매분 GPU를 추가로 지원하는 방안을 검토 중이다.

GPU 외에 데이터나 인재 등 추가적인 지원 여부에 대해 장기철 과장은 “후속 지원에 대해 GPU 말고도 선정된 업체들이 원하는 게 데이터라든지 있다면 지원하는 방법도 고민 중”이라며 “현재는 공고에 나와 있는 GPU 외에 다른 부분은 말씀드리기 어렵다”고 덧붙였다.

선정 기준은 ▲기술력 및 개발 경험(30점) ▲개발 목표(30점) ▲시장성 및 파급효과(40점)로 3가지다.

특화 파운데이션 모델 개발에 있어 프롬 스크래치나 파인튜닝(미세조정) 방식 등 제한은 없다. 다만, 잘못된 정보를 제공하는 환각률이 좀 더 낮게 나타난다는 측면에서, 모델의 첫 단계부터 구축하는 프롬 스크래치 방식과 특정 분야 대규모 데이터를 사전 학습하는 방식을 좀 더 지향한다.

사업에 참여하는 컨소시엄은 총 사업비에 대해 민간부담금이 있다. 기업 규모와 오픈소스 수준에 따라 자부담금이 차등 부여된다.

GPU 물량을 금액으로 환산해 정부지원금으로 책정하고, 민간부담금(현금+현물)을 매칭한다. GPU는 월별 단가 660만원으로, 정부지원금은 <GPU 개수xGPU 월별 단가x협약개월수>로 계산한다.

자부담율 부과 방안 (자료=과학기술정보통신부)
민감부담금 중 현금부담 기준 및 현물부담금 산출 기준 (자료=과학기술정보통신부)

생태계 확산 측면에서 오픈소스를 지향하기 때문에, 모델을 비공개하거나 연구용으로 일부 공개하는 방식보다 상업용처럼 개방 수준이 높을수록 자부담율이 적다. 현금 기준에 있어 중견기업과 대기업보다 중소기업 등이 민간부담금이 적게 부과된다. 중소기업은 총 금액의 10%, 중견기업은 13%, 공기업이나 대기업은 15% 이상이다. 현물 부담에서는 인건비와 유형자산(장비, SW 등)에 대한 계산만 인정한다. 민감부담금은 비영리기관과 사업계획서상 정부 지원 GPU를 활용하지 않는 참여 기관은 제외된다.

오픈소스 수준은 평가에도 반영된다. 장기철 과장은 “가급적이면 글로벌 시장에서 선도할 수 있는 모델을 만드는 것이 목표이기 때문에, 상업용 쪽으로 가는 게 정책에 부합한다”고 설명했다. 국내 다양한 AI 기업들이 사용할 수 있고, 해외에서도 쓸 수 있는 오픈소스 모델 개발이 지향점이기 때문이다.

평가절차는 서류 적합성 검토 후 발표 평가를 진행한다. 8개 이상 참여팀이 접수하면 서면평가를 먼저 진행한 뒤 발표 평가를 진행한다. 이후 사업비 검토 후 최종 지원팀을 선정한다.

평가에 있어 장기철 과장은 “우리나라가 잘하는 분야를 중심으로 해당 기업이 얼마나 많은 데이터를 가지고 있고, 얼마나 많은 개발 경험과 인력을 가지고 있는지 등이 주된 평가 포인트가 될 것”이라며 “컨소시엄을 어떻게 잘 구성할 것인지도 보고 있다”고 설명했다. 전문적인 데이터를 갖추고 많은 경험을 쌓은 기업이 유리하다는 의미다.

마지막으로 장 과장은 “이 사업도 독자 파운데이션 모델 사업처럼 잘 성공할 수 있도록 과기정통부에서 적극적으로 지원하겠다”고 밝혔다.

글. 바이라인네트워크
<최가람 기자> ggchoi@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.