[DAN23] ‘로봇 눈 완성’ 3차원 혁신 꿈꾸는 네이버랩스유럽

마틴 휴멘버거 네이버랩스 유럽 연구소장 발표 나서
디지털트윈(현실복제) 3D 비전 파운데이션 모델 연구
“생성형 AI는 디지털 세상 변화, 우린 물리 세계서 산업 혁신”

인공지능(AI) 기술의 최종장은 로봇이다. 사람과 닮은 안드로이드 로봇을 완성하기 위한 핵심이 ‘비전 AI’로, 로봇의 눈을 만드는 기술이다. 눈이 있어야 현실 세계와 상호작용할 수 있다. 네이버랩스 유럽이 로봇에 적용할 비전 파운데이션 모델(범용 초거대모델)을 연구 중이다.

지난 2017년, 네이버는 프랑스 최대이자 글로벌 최고 수준의 AI 연구소로 알려진 제록스리서치센터유럽(현 네이버랩스 유럽)을 인수 후 로봇과 비전 분야를 중심으로 연구를 고도화하고 있다. 2019년부터는 전세계 AI, 로봇, 비전 분야 석학들과 함께 관련 분야의 최신 연구 동향과 기술을 공유하는 ‘AI 포 로보틱스(AI for Robotics)’라는 글로벌 워크숍을 개최해오고 있다.

네이버가 24일 개최한 단23 컨퍼런스에서 미래 로봇 분야의 ‘AI 경쟁’에서도 한 걸음 앞서 있음을 알렸다. 자회사 네이버랩스를 통해 미래 로봇 시장을 멀리 내다보고 연구개발과 투자를 아끼지 않는 모양새다.

마틴 휴멘버거 네이버랩스 유럽 연구소장 (사진=네이버)

이날 네이버랩스 유럽의 마틴 휴멘버거 연구소장이 나와 ‘로봇 AI’를 위한 파운데이션 모델의 필요성과 네이버랩스가 연구 중인 ‘크로코(CROCO)’를 설명하는 세션을 가졌다. 그는 CROCO를 ‘로봇과 디지털 트윈을 위한 3D 비전 파운데이션 모델’로 정의했다.

마틴 휴멘버거 연구소장은 “생성형 AI가 세상을 변화시키고 있다지만 정확히는 디지털 세상을 변화시키고 있는 것”이라며 “AI를 우리가 살아가는 ‘물리 세계’에 적용할 때 로봇을 비롯한 여러 산업들에 혁신을 가져오게 될 것”이라며 발표를 시작했다.

그는 네이버랩스 유럽이 로봇과 물리 세계를 연결하는 AI를 오랫동안 연구한 점을 짚으며 “네이버랩스 유럽은 2021년부터 연구 과제 대부분을 파운데이션 모델 기반으로 과감히 전환했다. 기존의 AI 연구 방식으로는 실제 세계의 복잡한 환경과 변수들에 대응하는데 한계가 있었기 때문”이라고 설명했다.

연구소장에 따르면 네이버랩스 유럽이 중점을 두고 연구하는 분야는 ▲로봇이 다양한 환경에서 태스크를 수행하는 ‘행동(action)’ ▲로봇이 환경을 이해하고 인지하는 ‘비전(vision)’ ▲로봇과 인간의 ‘상호작용’ 등 크게 세 가지로 요약된다.

마틴 휴멘버거 연구소장은 “3D 비전 기반의 파운데이션 모델인 CROCO를 구축해 다양한 연구를 진행하고 있다”며 “사람이 두 눈으로 3차원을 인식하는 것처럼 AI가 현실 세계를 이해할 수 있도록 다른 시점의 같은 장면을 담은 수많은 이미지를 학습시켰다”고 말했다.

또 그는 “로보틱스 분야의 AI 연구는 네이버랩스 유럽이 세계 최고 수준이라는 것이 그간의 내외부 평가이지만 파운데이션 모델 적용 후 그 격차를 더욱 크고 빠르게 늘리고 있다”면서 “AI의 성능도 크게 개선되었지만 그보다 중요한 것은 도메인이 다른 연구자들끼리 파운데이션 모델을 통해 서로의 시너지를 높인다는 점”이라고 연구 현황을 전했다.

마틴 휴멘버거 소장은 “미래에는 1000대의 로봇이 1000개의 각기 다른 태스크를 수행하기 위한 AI가 필수”라며 “전 세계에서 이러한 비전에 가장 가까이 다가가고 있는 곳이 바로 네이버랩스”라고 힘줘 말했다.

글. 바이라인네트워크
<이대호 기자>ldhdd@bylin.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다