[그게 뭔가요] 미친 발전 속도의 휴머노이드, 테슬라 봇 옵티머스

등장

2021년 테슬라 AI 데이에서 휴머노이드 ‘테슬라 봇’이 공개됐다. 초창기 제원은 현재와 약간 다른 편인데 키는 173cm, 무게는 약 57kg, 40개의 액추에이터를 사용하고 이동 속도는 인간 도보 속도의 2배 정도인 시속 8km 정도를 목표로 했다. 일런 머스크 CEO는 “인간이 충분히 도망칠 수 있는 속도”라고 밝혔다. 카메라는 총 8개가 사용되며, 테슬라 FSD와 동일한 소프트웨어를 사용해 사물을 인식하고, 실내를 주행하며 물건을 들어 올린다. 들어 올릴 수 있는 무게는 68kg 정도가 될 것으로 내다봤다. 해당 발표 시 일론 머스크는 “미래에 차량 이상의 수익원이 될지도 모른다”며 테슬라 봇에 대한 기대감을 내비쳤다.

상세 구동 방식 발표 – 2022년 AI 데이

YouTube video

약 1년여가 지난 후 스스로 걸을 수 있는 프로토타입이 공개되었다. 이때 상세한 제원이 공개되었으며 연구를 거듭해 몇가지 제원 변경이 있음을 밝혔다.

위 이미지의 오렌지색 부분은 액추에이터(구동부)이며, 푸른 부분은 배터리를 포함한 전자 장비 일체를 포함하고 있다. 배터리는 총 2.3kWh로, 앉아있을 때의 소비 전력은 100W, 걸을 때의 소비전력은 500W다. 총 8시간을 사용할 수 있으며 몸무게는 73kg으로 약간 늘어났다. 무게와 비용을 최대한 줄이기 위해 금속 소재가 필요한 부분 외에는 단단한 플라스틱을 적용했다. 마이크를 통해 사람의 음성을 인식하며, 와이파이, LTE로 통신한다. 아직까지 밝혀지지는 않았으나 까만 얼굴에는 감정을 표현하는 LED가 탑재될 것으로 예상된다.

무릎의 경우 사람의 방식을 흉내 내려 했으나, 네개의 뼈가 각각 분리되어 있고 근육이 이를 감싸는 사람 무릎의 형태를 동일하게 만들 수 없어 내부 관절 모양을 인간과 조금 다르게 설정했다. 그 결과 보스턴 다이내믹스의 아틀라스나 혼다의 아시모처럼 약간 굽은 다리 형태를 갖게 되었다.

액추에이터의 경우 겹치는 부분을 합치고 줄여 28개를 탑재했다. 액추에이터를 줄이는 과정에서 에너지 소비도 줄게 되었다. 특히 여러 연구 결과에서 무게와 비용 중 최저값을 찾아내 적용했다. 액추에이터는 총 6개의 주요 디자인을 직접 설계했으며, 크게 크로스 롤러 베어링 방식과 볼 베어링 방식으로 나눈다. 이 액추에이터 하나가 그랜드 피아노 하나를 들어 올릴 수 있을 정도의 무게를 갖지만 신체를 지탱하는 데도 에너지를 사용하므로 실제로 로봇이 이 정도 무게를 드는 것은 아니다.

손에는 총 6개의 액추에이터가 탑재돼 있으며, 손가락은 인간 친화적인 공장에서 일하기 위해 다섯개를 꼭 탑재해야만 했다고 밝혔다. 자유도는 11가지 정도이며 손 하나당 약 9kg의 물건을 들 수 있고, 정밀한 도구를 사용할 수 있다. 작은 파트도 정확하게 잡을 수 있도록 설계되었다.

소프트웨어는 테슬라 차량의 FSD를 그대로 사용하며, GPS 신호와 비전 AI로 사물을 인식한다.

움직임 훈련은 모션 캡처를 통해 레퍼런스를 학습하고, 온라인 동작 적용(Online Motion Adaption)으로 사람의 관절 움직임과 옵티머스의 액추에이터 움직임 차이를 보정해 적용한다. 이때 실제로 움직임을 학습하고 이후 같은 방식으로 일하게 된다.

2023년 5월 – 실제 일하는 로봇의 영상 등장

2022년 발표 역시 센세이셔널한 편이었다. 특히 로봇 공학자 대부분이 말도 안 되는 발전 속도라고 평가했다. 그러나 반대로 이론에 불과하지 않느냐는 비판도 있었다. 이러한 비판을 잠재우듯 테슬라는 5월 주주총회에서 실제로 움직이는 로봇의 영상을 공개했다.

YouTube video

 

1분짜리 영상에서 옵티머스는 드디어 별도의 지지대 없이 걷기 시작했으며, 계란과 같은 사물을 살짝 건드릴 수 있을 정도로 힘 조절이 가능하다는 것을 보여주었다. 실내 주행에만 머물렀던 이전 영상들과 달리 외부에서의 걸음도 가능함을 보여주었으며, 2022년 발표와 같이 사람의 훈련을 그대로 학습해 노동을 하는 것을 보여주었다. 또한, 화분 손잡이를 정확히 잡고 화분에 물을 주는 등의 행동도 가능하다는 것을 보여준다.

2023년 9월 – 분류와 요가

YouTube video

9월 25일 공개된 영상에서는 옵티머스가 간단한 수준의 분류를 할 수 있다는 것을 보여주었다. 같은 색의 블록을 같은 색의 쟁반에 담는 훈련이었으며, 중간에 인간이 방해를 해도 즉각 반응할 수 있다는 것도 보여주었다. 또한, 블록의 형태를 제대로 인식해 바로 세우는 모습도 보여준다.

이 발전 속도가 무서운 이유는 이 학습이 AI 트레이닝과 유사하기 때문이다. 실제로 초기 동작은 인간의 모션 캡처를 사용해야 하지만, 이후의 행동은 별도의 코딩이나 스크립트가 아닌 비전 AI와 테슬라의 슈퍼컴퓨터 Dojo와의 연결로만 실행할 수 있다. 테슬라 차량 FSD와 같은 방식이다. 영상에서 옵티머스는 비전 AI만으로 자신의 관절을 인식하고 관절 인코더를 가동한다. 복잡한 연산이나 사전 정의된 스크립트 없이 움직이기 때문에 더 빠른 학습이 가능하다. 즉, 초창기 일런 머스크 CEO가 밝힌 목적처럼 단순하고 지루하고 위험한 작업을 대체할 수 있다.

이후 요가 동작을 선보이며 한 발로 설 수 있음을 보여주었다. 옵티머스는 현재까지 스스로 일어나는 시연을 보여준 적이 없다. 즉, 넘어지지 않기 위해 많은 노력을 하고 있음을 알 수 있다. 2022년 AI 데이에서는 넘어졌을 때 어깨가 돌출돼 핵심 구동부가 다치지 않게 하는 방식을 연구 중이라고 밝힌 바 있다. 이는 테슬라 차량 충돌 테스트와 같은 과정으로 진행된다.

보스턴 다이내믹스 아틀라스와의 차이

YouTube video

자신보다 수십배의 무게를 들고, 공중제비를 돌 수 있는 아틀라스와, 겨우 걷고 겨우 물건을 분류하는 옵티머스는 지향점이 다른 제품이다. 아틀라스는 인간이 해결하기 어려운 원전 사건 등에 투입될 수 있는 강한 로봇(심지어 군사용으로도 사용할 수 있다)이며, 전기 모터가 아닌 유압 구동 장치로 구동돼 인간보다 훨씬 더 큰 힘을 낼 수 있다.

옵티머스는 인간보다 큰 힘을 낼 수도 없고, 넘어졌을 때 아틀라스처럼 벌떡 일어나는 방법까지도 아직 구현하지 못했다. 그러나 별도의 코딩으로 움직임을 만들어 내야 하는 아틀라스는 학습에 많은 시간이 걸린다. 반대로 반복 훈련과 비전 AI만으로 움직이는 옵티머스는 훈련이 그만큼 쉽다. 무엇보다 가격에서 큰 차이가 난다. 판매용이 아니므로 정확한 가격이 공개되지 않은 아틀라스는 약 10억원대로 가격이 예상되고 있다. 그러나 옵티머스는 2만달러, 우리돈으로 역 2700만원에 출시하는 것을 목표로 한다.

옵티머스 출시 시기

일런 머스크는 내년(2024년)부터 양산을 시작해 3~5년 내 옵티머스를 보급할 것이라고 밝히고 있다. 테슬라 제품 특성상 이것보다 긴 시간이 걸릴 가능성이 놓지만, 10년 내 옵티머스가 인간의 노동 일부를 대체하기 시작할 것만큼은 확실해 보인다. 저렴한 가격, 단순한 훈련 방식, AI를 적극 활용한 단순한 구동 방식 때문이다.

글. 바이라인네트워크
<이종철 기자> jude@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다