10초. 주문이 접수된 후 휴머노이드 로봇이 매대로 이동해 콜라 한 병을 집어 계산대로 가져오는 데 소요되는 시간이다. 숙련된 점원이 빠르게 움직이는 속도와 대등하거나 오히려 더 효율적인 수치다. 그런데 이 효율성은 단순한 속도 경쟁이 아니라, 15㎡라는 극소형 공간 내에서 24시간 무인 운영이 가능하다는 물리적 제약의 극복과 결합하며 상업적 실효성을 증명하고 있다.

중국 허페이(合肥)시에 문을 연 이 매장은 도시 내 첫 번째 완전 자율 무인 로봇 소매점이다. 3x5m라는 협소한 면적임에도 불구하고 최근 하루 1,000명 이상의 방문객이 이용하는 밀도를 보였다. 주목할 점은 이곳의 운영 주체가 사람이 아닌 '샤오마이(小麦)'라는 이름의 로봇 직원이라는 사실이다. 로봇은 단순히 정해진 궤도를 움직이는 것이 아니라, 주문에 따라 상품을 식별하고 운반하는 전 과정을 자동화했다.

반면, 기존의 무인 매장이 단순히 결제 시스템의 자동화에 그쳤다면, 제리스(zerith, 零次方机器人)가 선보인 모델은 상품의 '피킹(Picking)'과 '분류', '운반'이라는 물류의 핵심 단계를 휴머노이드 로봇이 직접 수행한다는 점에서 궤를 달리한다. 24시간 연중무휴로 가동되는 이 시스템은 인건비 제로라는 경제적 이점과 더불어, 좁은 공간에서도 다양한 품목을 취급할 수 있는 유연성을 확보했다. 이제 시장의 관심은 이 기술적 구현이 실제 수익성으로 어떻게 연결되는가에 쏠려 있다.

허페이 무인 소매점의 운영 지표와 제리스 H1의 등장

허페이시의 무인 소매점은 가로 3m, 세로 5m의 총 15㎡ 규모로 운영된다. 이 좁은 공간에서 로봇 직원이 상품 판매 전 과정을 전담하며 24시간 연중무휴 체제를 유지한다. 주목할 점은 공간의 협소함에도 불구하고 하루 방문객 수가 1,000명을 상회한다는 사실이다. 기존의 무인 매장이 단순히 키오스크와 보안 게이트에 의존해 고객의 자율 결제에 맡겼다면, 이곳은 물리적 조작이 가능한 로봇이 실시간으로 대응하며 상품을 직접 전달하는 구조를 취한다.

운영의 핵심은 휠형 휴머노이드 로봇인 제리스 H1(ZERITH-H1, 바퀴형 인간형 로봇)을 기반으로 개발된 샤오마이(小麦)다. 이 로봇은 3D 멀티모달 감지 시스템(시각과 촉각 등 여러 감각 정보를 통합 처리하는 시스템)을 탑재해 범위 내 상품을 정확히 식별하고 집어 올린다. 주문이 접수되면 로봇이 매대로 이동해 콜라 한 병을 집어 계산대로 가져오는 과정이 10초 이내에 완료된다. 반면 로봇의 집게 범위 내에 있는 상품이라면 음료뿐만 아니라 간식이나 갓 내린 커피 등 취급 품목을 매장 설정에 따라 자유롭게 변경할 수 있는 유연성을 갖췄다. 또한 단순 반복 작업 외에 손님과 농담을 주고받는 사회적 상호작용 기능까지 포함되어 고객 경험의 영역을 확장했다.

이 시스템을 구축한 허페이 제리스(zerith, 零次方机器人)는 칭화대학교 출신 졸업생들이 주축이 되어 설립한 휴머노이드 로봇 전문 기업이다. 이들은 로봇의 범용적인 성능 구현보다 소형 매장이라는 특수한 환경에서의 자동화 효율을 극대화하는 전략을 택했다. 상품의 집기, 분류, 운반이라는 물류의 핵심 공정을 3x5m라는 극도로 제한된 면적 내에서 최적화하여 구현한 결과다. 이는 대규모 물류 센터의 자동화 방식을 소규모 리테일 접점으로 축소하여 이식한 형태에 가깝다.

실제 운영 데이터는 상하이 지역의 사례에서 더욱 구체적으로 드러난다. 올해 3월 상하이에 설치된 3곳의 동일 모델 로봇 매장 중 한 곳은 5월 초 연휴 기간 동안 주간 매출 2만 위안(약 441만 원)을 기록했다. 일일 최고 주문량 역시 1,000건을 돌파하며 실제 시장의 수요를 증명했다. 이러한 운영 지표를 기반으로 산출된 투자금 회수 기간은 약 1년으로 추산된다. 이는 기술적 가능성을 넘어 소규모 무인 매장 모델의 상업적 생존 가능성을 구체적인 수치로 입증한 결과로 분석된다.

3D 멀티모달 감지 시스템 기반의 상품 처리 메커니즘

ZERITH-H1(제리스 H1, 휠형 휴머노이드 로봇)은 하체에 바퀴를 장착한 구조를 채택하여 이동의 안정성과 효율성을 확보했다. 이는 균형 잡기가 까다로운 이족 보행 방식보다 좁은 매장 내에서 빠른 회전과 정밀한 정지가 가능하기 때문이다. 핵심 제어 장치는 3D 멀티모달 감지 시스템(시각, 촉각 등 다양한 센서 데이터를 통합해 사물을 인식하는 기술)이다. 이 시스템은 매장 내 상품의 3차원 좌표를 실시간으로 매핑하며 상품의 외형과 위치를 동시에 분석한다. 그러나 단순히 물체를 찾는 수준을 넘어 상품의 부피와 무게 중심을 계산해 최적의 파지 지점을 결정한다는 점이 기술적 핵심이다.

상품 처리 메커니즘은 식별, 집기, 분류, 운반의 4단계 공정으로 구성된다. 주문 데이터가 입력되면 로봇은 즉시 해당 상품의 위치를 식별하고 최단 경로로 이동한다. 이후 정밀 집게를 이용해 상품을 집어 올리며 이 과정에서 멀티모달 센서가 실시간 피드백을 제공해 미끄러짐을 방지한다. 집어 올린 상품을 지정된 계산대로 분류하여 운반하는 전 과정은 완전히 자동화되어 있으며 실제 콜라 한 병을 전달하는 데 걸리는 시간은 10초 미만으로 측정된다. 반면 기존의 단순 서빙 로봇이 지정된 지점으로 이동하는 것에 그쳤다면 ZERITH-H1은 상품의 개별 특성에 맞춘 능동적 제어를 수행한다. 주목할 점은 3x5m라는 제한된 면적 내에서 회전 반경을 최소화하여 동선 겹침 현상을 방지했다는 사실이다.

취급 가능한 품목은 로봇 집게의 물리적 가동 범위 내에 있는 모든 상품으로 정의된다. 규격화된 간식이나 음료병은 물론이고 갓 내린 커피와 같이 흔들림에 취약한 품목까지 처리 범위에 포함된다. 이는 3D 감지 시스템이 액체의 출렁임이나 컵의 재질에 따른 마찰력을 계산하여 운반 속도와 가속도를 정밀하게 조절하기 때문이다. 하지만 하드웨어적 정밀도 외에 소프트웨어적 인터랙션 기능도 탑재되었다. 로봇은 고객에게 농담을 건네는 등 사회성 인터랙션(인간과 로봇 간의 정서적 상호작용)을 수행하며 단순한 기계적 처리 장치를 넘어선 서비스 접점 역할을 한다. 이러한 구조는 협소한 공간 내에서 효율적인 물류 처리와 고객 응대를 동시에 달성하려는 설계 의도를 명확히 보여준다.

기존 무인 매장 대비 ZERITH-H1의 운영 효율 비교

기존 무인 매장의 자동화 범위는 결제 단계에 집중되어 있다. 고객이 상품을 직접 집어 계산대로 가져오는 방식이며, 시스템은 이를 인식하고 결제하는 것에 그친다. 반면 ZERITH-H1(제리스 H1, 휠형 휴머노이드 로봇)은 물류의 전 과정을 자동화한다. 주문이 접수되면 로봇이 직접 매대로 이동해 콜라 한 병을 정확히 집어 계산대로 전달하며, 이 과정에 소요되는 시간은 10초 미만이다. 이는 단순한 결제 편의를 넘어 상품의 이동이라는 물리적 노동 자체를 로봇이 완전히 대체했음을 의미한다. 기존의 무인 시스템이 고객의 노동력을 전제로 했다면, 이 모델은 로봇의 노동력을 통해 서비스 구조를 재편했다.

공간 활용 측면에서도 기존 방식과 궤를 달리한다. 일반적인 무인 매장은 상품 진열대와 고객의 이동 동선을 확보하기 위해 일정 수준 이상의 면적이 필수적이다. 그러나 ZERITH-H1은 3x5m의 극소형 면적 내에서 상품 집기, 분류, 운반의 전 과정을 구현한다. 15㎡라는 제한된 공간에서도 완전한 자동화 운영이 가능하다는 점은 도심 내 초소형 입지에서도 매장 운영을 가능하게 한다. 주목할 점은 이 좁은 면적이 단순한 상품 보관소가 아니라, 로봇의 동선 최적화를 통해 능동적인 물류 거점으로 작동한다는 사실이다. 이는 공간 효율성이 곧 수익성으로 직결되는 소매업의 특성상 매우 강력한 경쟁 우위가 된다.

운영의 유연성 또한 기존 자동화 설비 대비 우위에 있다. 특정 규격의 상품만 취급하는 자동판매기 방식은 품목 변경 시 하드웨어 구조를 전면 수정해야 하는 제약이 크다. 반면 ZERITH-H1은 로봇의 집게 범위 내에 있다면 간식, 음료, 갓 내린 커피 등 취급 품목을 자유롭게 확장할 수 있다. 이는 3D 멀티모달 감지 시스템을 통해 상품을 식별하기 때문에 가능한 결과다. 매장 상황에 맞춘 설정 변경만으로도 상품 라인업을 즉각적으로 최적화할 수 있으며, 이는 시장 수요 변화에 빠르게 대응하는 운영 유연성으로 이어진다. 하드웨어의 고정성을 소프트웨어의 유연성으로 극복한 사례다.

인력 구조의 변화는 더욱 극명하게 나타난다. 기존 무인 매장 역시 관리 인력이 필요하지만, ZERITH-H1은 판매 전담 인력을 휴머노이드 로봇으로 완전 대체한다. 단순한 키오스크의 역할을 넘어 상품의 픽킹과 전달이라는 서비스 영역까지 로봇이 전담하기 때문이다. 이러한 인력 대체는 인건비 절감을 넘어 24시간 연중무휴라는 운영 안정성을 물리적으로 보장하는 결과로 이어진다. 결과적으로 물류 자동화를 통한 운영 효율은 일일 최고 주문량 1000건 돌파라는 수치와 1년 내 투자금 회수 가능성이라는 경제적 실익으로 구체화된다. 이는 단순한 기술 과시가 아니라 실질적인 운영 비용의 최적화를 달성했음을 보여준다.

상하이 매장 데이터로 본 매출 성과와 ROI 분석

상하이 지역에 설치된 3개 매장의 운영 데이터는 단순한 기술 시연을 넘어 상업적 가능성을 수치로 증명한다. 지난 5월 초 연휴 기간 중 단일 매장에서 기록한 주간 매출은 2만 위안(약 441만 원)을 돌파했다. 일일 최고 주문량 역시 1,000건을 넘어섰다. 이는 휴머노이드 로봇이 실제 유동 인구가 많은 상업 지구에서 처리 가능한 주문 처리량의 임계치를 확인했다는 점에서 의미가 있다. 특히 피크 타임의 주문 집중도를 로봇이 단독으로 처리하며 병목 현상을 최소화했다는 점이 데이터에 반영되어 있다.

반면 기존의 무인 매장이 키오스크와 단순 픽업함에 의존해 고객이 직접 상품을 찾는 방식이었다면, 제리스 H1(ZERITH-H1, 휠형 휴머노이드 로봇)은 상품 집기부터 운반까지의 전 과정을 자동화했다. 로봇이 3x5m의 제한된 면적 내에서 효율적으로 움직이며 주문을 처리하는 구조다. 주목할 점은 24시간 연중무휴 운영이 가능하다는 사실이다. 인건비라는 변동성과 고정 비용을 동시에 제거하고 운영 시간을 극대화함으로써 매출 발생 빈도를 물리적으로 높인 결과다. 이는 사람이 근무할 때 발생하는 교대 근무 비용과 관리 공수를 완전히 배제한 수치이며, 로봇의 집게 범위 내에 있는 상품이라면 품목에 상관없이 취급 가능하다는 유연성까지 확보했다.

이러한 매출 흐름과 운영 비용을 기반으로 분석한 투자금 회수 기간은 약 1년으로 추산된다. 일반적인 서비스 로봇 도입 사례가 단순 홍보나 상징적 비용 절감에 그쳐 명확한 회수 기간을 산정하기 어려웠던 과거 사례들과는 대조적이다. 3D 멀티모달 감지 시스템(시각, 촉각 등 여러 감각 정보를 통합 처리하는 시스템)을 통해 상품 식별 오류를 줄이고 처리 속도를 10초 이내로 단축한 점이 ROI(Return on Investment, 투자 자본 수익률) 개선의 핵심 동력으로 작용했다. 초기 하드웨어 도입 비용이 발생함에도 불구하고, 운영 단계에서의 낮은 유지비가 빠른 손익분기점 도달을 가능케 했다.

실무적 관점에서 보면 15㎡ 규모의 소형 매장에서 일일 1,000건의 주문을 처리하는 운영 밀도는 매우 높다. 이는 로봇의 하드웨어 제어 능력과 경로 최적화 알고리즘이 실제 상업 환경의 변수 속에서도 안정적으로 작동하고 있음을 시사한다. 그러나 이러한 성과가 모든 소매 품목으로 즉각 확장될 수 있을지는 냉정하게 판단해야 한다. 현재는 음료나 간식 등 규격화된 상품 위주로 운영되고 있으며, 취급 상품의 다양성이 증가할수록 로봇의 집게 범위와 인식 정밀도에 대한 요구 수준은 더욱 높아질 수밖에 없다. 결국 데이터가 보여주는 1년의 회수 기간은 표준화된 상품군이라는 전제 조건 하에서의 최적화 결과다.

한국 리테일 AI 실무 관점에서의 시사점

국내 무인 점포의 운영 방식은 고객이 직접 상품을 집어 키오스크(Kiosk, 무인 단말기)에서 결제하는 수동적 구조에 머물러 있다. 반면 제리스 H1(ZERITH-H1, 휠형 휴머노이드 로봇)이 도입된 매장은 로봇이 주문 접수 후 상품을 직접 피킹하여 전달하는 능동적 방식으로 구동된다. 이는 단순한 결제 프로세스의 자동화를 넘어 매장 내 물류의 최종 단계인 라스트 마일 피킹까지 자동화 영역을 확장한 결과다. 기존 무인 매장이 겪던 상품 도난이나 오결제 문제를 로봇의 직접 제어를 통해 원천적으로 차단할 수 있다는 점이 실무적인 차별점이다.

15㎡ 규모의 소형 매장에서 하루 1000건 이상의 주문을 처리한 수치는 국내 편의점이나 소규모 카페 환경에 즉시 적용 가능한 수준이다. 3×5m라는 좁은 공간 내에서 상품 집기, 분류, 운반을 모두 수행하는 휠형 구조는 공간 효율성을 극대화해야 하는 한국의 도심형 리테일 샵에 최적화된 형태다. 그러나 실제 도입을 위해서는 한국 특유의 고밀도 상품 배치 환경과 좁은 통로 구조에 맞는 정밀한 경로 최적화 알고리즘이 선행되어야 한다. 특히 상품의 회전율이 높은 국내 편의점 특성상 실시간 재고 파악과 로봇의 피킹 동선 간의 정밀한 동기화가 운영 효율의 핵심이 된다.

칭화대 출신 연구진 중심의 상용화 속도는 학계의 이론이 실제 비즈니스 모델로 전환되는 주기가 극도로 짧아졌음을 보여준다. 핵심은 3D 멀티모달(3D Multimodal, 시각, 청각 등 여러 감각 정보를 동시에 처리하는 시스템) 감지 시스템을 통한 상품 식별 능력이다. 주목할 점은 국내 도입 시 한국어 자연어 처리 최적화와 더불어 국내 유통 상품의 다양한 패키징 형태와 재질에 대응하는 학습 데이터 확보가 필수적이라는 사실이다. 투명한 페트병이나 반사 재질의 포장재는 3D 센서의 오작동을 유발할 수 있으므로 한국 시장의 상품군에 맞춘 엣지 케이스(Edge Case, 일반적이지 않은 예외 상황) 학습이 필요하다.

기존 무인화 시장이 인건비 절감을 위한 키오스크 보급에 집중했다면 이제는 로봇 피킹 중심의 완전 무인화로 전환되는 시점이다. 단일 매장 주간 매출 2만위안과 투자금 1년 회수 가능성이라는 수치는 로봇 도입의 경제적 타당성을 입증하는 구체적인 지표가 된다. 반면 단순 반복 작업의 자동화를 넘어 손님과의 상호작용까지 수행하는 사회성 구현 여부가 실제 고객 경험의 차별화를 결정짓는 변수가 될 것이다. 결국 하드웨어의 보급보다 중요한 것은 한국 리테일 환경의 복잡한 상품 SKU(Stock Keeping Unit, 상품 관리 최소 단위)를 얼마나 빠르게 학습하고 정확하게 피킹하느냐는 소프트웨어적 최적화의 속도다.