중국 '바리스타 로봇'에 숨겨진 승부수... 그러나 한국은 이미 앞서 있다
작성자 정보
- 김프로 작성
- 작성일
본문
[중국AI미래지도] 알리바바와 샤오미가 공동 투자한 스피릿AI의 정체
[임선영 기자]
▲ 모즈로봇이 징동 오프라인 매장에서 바리스타로 활약하는 모습.
ⓒ 스피릿AI
1. 커피 한 잔이 말해주는 것
2026년 3월 중국 징둥(JD.com)몰 매장 한 켠에서 로봇이 커피를 내리기 시작했습니다. 에스프레소를 추출하고, 우유를 스팀하고, 잔에 담아 건네는 일련의 동작을 사람의 개입 없이 수행합니다. 이 장면만 보면 흥미로운 기술 시연처럼 보이지만 이 커피 한 잔에 즐거워하는 이들은 중국의 투자계 거물들입니다.
이 로봇을 만든 회사는 항저우 소재 스타트업 스피릿AI(千寻智能, Spirit AI)입니다. 2026년 4월 7일 이 회사는 신규 10억 위안(한화 약 2200억 원) 투자 유치를 발표했습니다. 주목할 것은 투자금의 규모가 아닌 투자자입니다.
알리바바의 마윈( Jack Ma)이 설립한 윈펑펀드(云锋基金)와 샤오미의 레이쥔(Lei Jun)이 창립한 순웨이자본(顺为资本)이 공동 리드 투자자로 참여했습니다. 바로 2월에 이미 20억 위안(한화 약 4380억 원) 투자유치를 받은 것을 합산하면 30일 만에 30억 위안(한화 약 6600억 원)을 모은 것입니다.
중국 이커머스+AI생태계 거장 알리바바와 스마트 하드웨어+AI 리더 샤오미가 동시에 같은 스타트업에 투자한 것은 이례적인 일입니다. 그런데 이들이 투자한 것은 커피 만드는 로봇에 투자한 것이 아닌 그 로봇 안에 들어 있는 무언가에 투자한 것입니다.
2. 스피릿AI는 로봇 회사가 아닙니다
스피릿AI의 정체를 이해하려면 이 회사가 무엇을 만들지 않는지를 먼저 봐야 합니다. 스피릿AI은 완성형 로봇을 만들지 않습니다. 로봇의 팔을 만들지도, 다리를 설계하지도 않습니다. 이 회사가 만드는 것은 로봇의 뇌입니다. 정확히는 피지컬 AI(Physical AI, 물리 세계에서 자율적으로 행동하는 인공지능) 대형 모델과 지능 의사결정 시스템입니다. 어떤 로봇 본체에도 올라갈 수 있는 범용 인지·판단·행동 능력, 즉 피지컬 AI의 소프트웨어 핵심입니다.
이 전략의 핵심은 두 가지입니다.
첫째, 저비용 실제 데이터 수집 혁명입니다. 스피릿AI는 자체 개발한 5세대 웨어러블(Wearable, 착용형) 데이터 수집 장비를 통해 고품질 실제 상호작용 데이터의 수집 비용을 기존 방식의 10분의 1로 낮췄습니다. 이미 20만 시간 이상의 다양한 유형 실제 상호작용 데이터를 확보했습니다. 데이터 수집의 병목을 기술적으로 해결한 것입니다. 데이터가 많아야 모델이 좋아지고 모델이 좋아야 로봇이 다양한 상황에서 제대로 작동합니다. 이 선순환의 시작점을 스피릿AI은 비용 혁신으로 열었습니다.
둘째, 제로샷 범용화(Zero-Shot Generalization, 새로운 과제에 대한 별도 훈련 없이 즉시 수행하는 능력)입니다. 2026년 1월 오픈소스로 공개한 스피릿 v1.5(Spirit v1.5) 모델은 글로벌 로봇 평가 기준인 로보챌린지(RoboChallenge) Table 30 실기 평가에서 미국의 표준 모델 파이 0.5(Pi 0.5)를 제치고 글로벌 1위에 올랐습니다. 핵심은 이 모델이 새로운 과제를 만났을 때 별도 훈련 없이 스스로 처리할 수 있다는 점입니다. 커피를 만드는 법을 배운 로봇이 주문서를 분류하는 법도 스스로 익힌다는 뜻입니다. 이것이 범용 대뇌의 실체입니다.
3. 왜 커피숍과 배터리 공장인가
스피릿AI이 선택한 두 현장은 언뜻 상관이 없어 보입니다. 세계 최대 배터리 제조사 CATL(宁德时代)의 중저우(中州) 기지 초대형 공장과 징둥 오프라인 매장의 카페. 그런데 이 두 현장의 조합은 전략적으로 계산된 것입니다.
공장은 정밀성과 반복성을 검증하는 환경입니다. 스피릿AI의 모즈로봇은 CATL 공장에서 배터리 접속 검사를 담당하며 누적 약 1000개 배터리를 생산했고 접속 성공률 99% 이상을 기록했습니다. 이것은 실험실 수치가 아닌 실제 양산 라인의 수치입니다.
카페는 비정형성과 인간 상호작용을 검증하는 환경입니다. 공장과 달리 카페에서는 고객의 주문이 매번 다르고 환경이 예측 불가능하며 사람과의 접점이 필수입니다. 같은 모델이 두 환경을 모두 소화한다면 범용성이 증명됩니다. 2026년 3월 징둥과 체결한 전략적 협력 협정은 이 카페 환경을 지속 가능한 데이터 생산 공장으로 전환하는 계약입니다. 로봇이 일하면서 동시에 데이터를 생산하는 구조입니다.
CATL·징둥·샤오미·알리바바·화웨이 등 이 회사의 주주들은 우연이 아니라 제조·유통·하드웨어·이커머스·통신업체입니다. 각각 다른 산업 생태계를 대표하는 이 기업들이 스피릿AI를 통해 하나의 범용 대뇌에 연결되는 구조입니다.
▲ 알리바바의 마윈과 샤오미의 레이쥔이 공동으로 설립한 스피릿AI의 홈페이지.
ⓒ 스피릿AI
4. 소프트웨어가 피지컬 AI 경쟁의 축이 됐습니다
중국 피지컬 AI 산업의 경쟁 구도는 이미 바뀌었습니다. 2026년 이 분야의 전체 투자 규모는 300억 위안(한화 약 6조 6000억 원)에 육박합니다. 그런데 그 자본이 향하는 곳이 달라졌습니다. 하드웨어 경쟁은 아직 진행 중이지만 차별화가 점점 어려워지고 있습니다. 유니트리(宇树科技, Unitree)가 휴머노이드 로봇을 9만 9000위안(한화 약 2000만 원)에 내놓으며 하드웨어 가격의 바닥을 낮췄습니다. 하드웨어 스펙은 빠르게 평준화됩니다.
반면 소프트웨어 경쟁은 이제 막 시작됐습니다. 범용 모델을 가진 회사는 어떤 하드웨어에도 올라탈 수 있습니다. 데이터를 가진 회사는 모델을 계속 개선할 수 있습니다. 이 두 가지를 동시에 가진 회사는 하드웨어가 어떻게 바뀌어도 생태계의 중심에 남을 수 있습니다.
스피릿AI의 공동 창업자 가오양(高阳)은 현재 피지컬 AI의 단계를 AI 대형 모델 초기의 GPT-2 수준이라 평가합니다. GPT-3 수준의 모델 혁신은 2026년 말에서 2027년 중반 사이에 올 것으로 보이며 대규모 상업적 적용은 2027년 하반기에서 2028년에 본격화될 것으로 전망합니다. 지금은 그 폭발의 직전입니다.
5. 한국 피지컬 AI가 가야 할 길은 하드웨어인가 소프트웨어인가
스피릿AI의 사례가 한국 피지컬 AI 산업에 던지는 메시지는 한국이 가진 고유한 경쟁 자산을 다시 보게 만듭니다. 스피릿AI은 카페와 배터리 공장을 데이터 생산 공장으로 전환했습니다. 핵심은 그 환경에서 나오는 데이터가 범용 모델을 진화시킨다는 것입니다. 그렇다면 한국이 피지컬 AI 모델에 학습시킬 수 있는 고유한 데이터는 무엇일까요.
두 가지 방향이 있습니다.
첫째, 제조와 서비스의 정밀함을 데이터로 만드는 것입니다. 한국은 반도체 패키징, 정밀 부품 조립, 식품 가공, 의료 기기 제조 등 세계 최고 수준의 정밀 제조 공정을 보유하고 있습니다. 이 공정에서 숙련 기술자가 수십 년간 축적한 손의 움직임, 판단의 패턴, 품질 검수의 기준은 세계 어디에도 없는 고유한 데이터입니다.
스피릿AI가 배터리 공장을 데이터 생산 공장으로 만들었다면 한국은 반도체 공장과 조선, 화학, 식품 생산 라인을 피지컬 AI 데이터의 원천으로 전환할 수 있습니다. 한국 제조의 정밀함을 학습한 모델은 글로벌 제조 현장에서 차별화된 경쟁력을 갖습니다.
둘째, 한국의 문화·엔터테인먼트 IP(Intellectual Property)를 피지컬 AI 모델에 학습시키는 것입니다. 이것은 지금까지 피지컬 AI 논의에서 한 번도 진지하게 다뤄지지 않은 방향입니다. 그러나 이것이 한국만이 가진 가장 강력한 차별화 자산입니다.
K-Pop 퍼포먼스의 정밀한 안무 데이터, K-Drama와 영화 속 감정 표현과 인간 상호작용 패턴, 한식 조리의 섬세한 동작 데이터, K-Beauty 서비스의 정밀한 터치 데이터. 이 모든 것이 피지컬 AI 모델이 학습할 수 있는 고품질 데이터입니다.
한류가 세계 시장에서 만들어낸 문화적 친밀감은 피지컬 AI 로봇이 그 문화 기반의 서비스를 제공할 때 즉각적인 시장 수용성으로 전환됩니다. 케이팝 안무를 학습한 엔터테인먼트 로봇, 한식 조리 데이터를 탑재한 F&B 서비스 로봇, 케이뷰티 메이크업 패턴을 학습한 케어 로봇. 이것이 중국 로봇과 정면 경쟁하지 않아도 되는 한국만의 피지컬 AI 시장입니다.
중국은 물량과 속도로 범용 데이터를 쌓고 있습니다. 한국이 같은 방식으로 경쟁하면 질 수밖에 없습니다. 그러나 세계가 소비하고 싶어하는 한국의 문화와 기술을 피지컬 AI 모델에 담는다면 이야기가 달라집니다. 알리바바와 샤오미가 커피 만드는 로봇에 6600억 원을 투자한 이유는 커피 때문이 아닙니다. 그 로봇이 커피를 만들면서 쌓는 데이터와 그 데이터로 진화하는 범용 대뇌 때문입니다. 피지컬 AI의 다음 전장은 문화입니다. 한국은 그 전장에서 이미 앞서 있습니다.
덧붙이는 글 | 임선영씨는 중국전문가로 <중국경제미래지도>의 저자입니다. 이 글은 본인의 페이스북에도 올렸습니다.
Copyright © 오마이뉴스. 무단전재 및 재배포 금지.
관련자료
-
이전
-
다음
댓글 0
등록된 댓글이 없습니다.
