48kg 거대 로봇과 3.8kg 소형봇의 격돌, RoboCup 2026 휴머노이드 리그

17개국 참가와 중국의 강세, RoboCup 2026 현황

세계 대회에 나가는 팀에게 가장 큰 변수는 상대의 정체다. 낯선 국가의 기술 수준을 가늠하지 못한 채 경기에 임하는 것은 도박과 같다. 이번 RoboCup 2026 휴머노이드 리그(인간형 로봇 축구 대회)는 전 세계 17개국이 참가하며 이러한 경쟁 구도를 실현했다. 대회 둘째 날까지 진행된 경기들은 많은 수의 매치가 촘촘하게 배치된 일정으로 운영되었으며, 다양한 국가의 엔지니어들이 각자의 제어 알고리즘과 하드웨어를 들고 모여 실제 경기장에서 성능을 겨루는 구조다.

참가국 중 가장 압도적인 규모를 보여준 곳은 중국이다. 중국은 이번 대회에 총 15개 팀을 출전시키며 단일 국가로는 최다 참가 기록을 세웠다. 중국 팀들은 특정 체급에 몰리지 않고 대회 운영 체계인 3개 디비전(Division, 로봇의 크기와 무게에 따라 나눈 경기 부문) 전체에 고르게 분포하여 경쟁력을 시험하고 있다. 이는 특정 국가의 하드웨어 보급률이나 연구 인력의 규모가 실제 대회 참가 수치로 직결된 결과이며, 중국 내 여러 대학과 연구소가 각기 다른 접근 방식으로 휴머노이드 제어 기술을 개발하고 있음을 보여준다.

참여 지역의 범위는 특정 대륙에 국한되지 않고 전 세계적으로 매우 넓게 퍼져 있다. 남미의 콜롬비아부터 동남아시아의 말레이시아, 유럽의 독일, 그리고 오세아니아의 호주까지 지리적으로 매우 광범위한 지역의 팀들이 이름을 올렸다. 각 팀은 서로 다른 설계 철학을 가진 로봇을 투입했으며, 이는 경기장에서 각기 다른 물리적 반응과 움직임으로 나타난다. 지리적 다양성은 곧 하드웨어 설계 방식의 다양성으로 이어져, 로봇이 공을 차거나 균형을 잡는 과정에서 발생하는 변수를 높이는 핵심 요소가 된다.

대회 운영의 핵심은 로봇의 체급을 고려한 3단계 디비전 체계다. 로봇의 크기와 무게가 제어 성능과 물리적 상호작용에 결정적인 영향을 미치기 때문에 Small, Middle, Large 세 가지 부문으로 나누어 경기를 진행한다. 체급별로 나누어 경쟁하는 방식은 하드웨어 스펙의 격차로 인해 발생할 수 있는 불공정한 물리적 충돌을 방지하고, 각 체급 내에서 최적의 제어 성능을 내는 소프트웨어 최적화 경쟁을 유도하기 위함이다. 17개국 팀들은 자신이 설계한 로봇의 물리적 특성에 맞는 디비전에서 승률과 득실차를 통해 피지컬 AI의 실제 제어 성능을 검증받는다.

영상 검증부터 레드카드까지, 경기 운영 및 안전 규칙

스포츠 경기에서 심판의 판정은 단순한 규칙 준수를 넘어 선수의 안전을 보호하는 최후의 보루다. 로봇 축구에서도 고가의 하드웨어 파손을 막기 위해 엄격한 사전 검증과 실시간 제재 시스템을 운영한다. 모든 참가 팀은 대회 신청 단계에서 팀 설명서와 로봇 및 소프트웨어 정보, 퀄리피케이션 영상을 필수적으로 제출한다. 퀄리피케이션 영상은 로봇이 경기 참여에 필요한 최소한의 동작을 수행할 수 있는지 증명하는 자격 심사 영상이다. 팀 설명서에는 로봇의 물리적 구조와 제어 방식이 명시되며, 소프트웨어 정보에는 로봇을 구동하는 운영체제와 알고리즘의 특성이 포함된다. 운영진은 제출된 서류와 영상을 대조하여 로봇이 경기장 환경에서 안전하게 작동할 수 있는지 확인한다. 이러한 사전 검증 과정은 준비되지 않은 기기가 경기장에 진입해 발생할 수 있는 대형 사고를 방지하는 기술적 진입 장벽으로 작동한다.

실제 경기 중 발생하는 돌발 상황은 옐로카드와 레드카드를 통해 실시간으로 제어한다. 심판은 로봇이 안전하지 않은 챌린지, 즉 다른 로봇이나 경기 시설에 물리적 충격을 주어 파손을 유발할 수 있는 위험한 동작을 수행했을 때 옐로카드를 부여한다. 안전하지 않은 챌린지는 주로 균형 제어 실패로 인한 급격한 전도나 의도하지 않은 강한 충돌 상황을 의미한다. 옐로카드는 해당 로봇의 제어 알고리즘이 현재 환경에서 불안정하게 작동하고 있다는 기술적 경고다. 옐로카드를 2회 누적한 로봇은 즉시 레드카드를 받고 경기에서 제외된다. 레드카드는 단순한 경기 규칙 위반에 대한 징계가 아니라, 안전상의 이유로 해당 기기를 즉각적으로 격리해야 한다는 강제 조치다. 실제로 이번 대회 경기 중 옐로카드 2회를 기록한 로봇이 레드카드를 받고 즉시 퇴장당하는 사례가 발생했다. 물리적 실체를 가진 피지컬 AI는 소프트웨어의 작은 연산 오류가 하드웨어의 영구적인 파손으로 직결되므로, 이러한 즉각적인 배제 규칙이 시스템의 전체 신뢰성을 유지하는 핵심 기제로 작동한다.

160cm ALICE 4와 53cm Chape, 하드웨어 스펙 대비

보통 스포츠 경기라면 선수들의 체급을 비슷하게 맞추는 것이 공정하다고 생각한다. 하지만 이번 휴머노이드 리그에서는 체급의 경계가 완전히 무너진 모습이 확인된다. HERoEHS 팀의 ALICE 4 로봇이 이번 대회에서 가장 크고 무거운 스펙을 기록했다. 무게는 48kg이며 높이는 160cm다. 성인 인간의 평균 체격과 유사한 이 크기는 물리적 충돌 상황에서 밀리지 않고 공에 강한 추진력을 전달할 수 있는 하드웨어적 이점을 가진다. 대형 로봇은 보폭이 넓어 경기장 전체를 빠르게 가로지를 수 있는 물리적 잠재력을 보유한다.

두 번째로 무거운 로봇은 BigHeroX 팀의 Z4 bipedal humanoid(인간처럼 두 발로 걷는 이족 보행 로봇)다. 무게는 37kg으로 가장 무거운 ALICE 4와는 11kg의 차이가 난다. 이와 비슷한 체급에서는 Unitree G1 플랫폼의 활용도가 높다. 무게 35kg인 Unitree G1은 다수의 팀이 공통적으로 도입한 범용 하드웨어 플랫폼이다. 팀들이 기구학적 설계를 처음부터 수행하는 대신 이미 검증된 표준 플랫폼을 선택함으로써 제어 소프트웨어의 최적화와 경기 전략 구현에 더 많은 시간을 할애한 결과다. 이는 하드웨어 제작보다 AI 제어 성능 경쟁으로 무게 중심이 이동했음을 보여준다.

반면 ITAndroids 팀의 Chape 로봇은 무게 3.8kg, 높이 53cm로 가장 작고 가벼운 스펙을 가졌다. 가장 무거운 ALICE 4와 비교하면 무게는 약 12.6배, 높이는 약 3배의 차이가 벌어진다. 53cm의 높이는 성인의 무릎 높이 정도로, 무게 중심이 매우 낮아 급격한 방향 전환이나 빠른 가속 시 균형을 잡기에 유리한 구조적 특징을 가진다. 소형 로봇은 대형 로봇보다 적은 에너지로 빠르게 움직일 수 있지만, 상대적으로 무거운 로봇과 충돌했을 때 쉽게 밀려나거나 균형을 잃을 가능성이 크다는 물리적 제약이 있다.

이처럼 3.8kg부터 48kg까지 극단적으로 갈리는 무게 분포는 피지컬 AI(물리적 환경에서 직접 동작하는 인공지능)의 제어 성능을 검증하는 핵심 지표가 된다. 48kg의 고중량 로봇은 큰 관성을 이겨내며 정밀하게 정지하거나 회전하는 능력이 필수적이다. 반면 3.8kg의 저중량 로봇은 외부의 작은 충격에도 쉽게 균형을 잃을 수 있어 이를 실시간으로 보정하는 능력이 요구된다. 서로 다른 하드웨어 제약 조건 속에서 동일한 축구 동작을 구현하기 위해 각 팀이 선택한 제어 알고리즘의 차이가 이번 리그의 기술적 실체다.

CAU Mountain&Sea와 B-Human, 시딩 라운드 상위권 성적

시딩 라운드(예선전)의 성적표는 단순히 승패를 넘어 각 로봇의 제어 알고리즘이 실전 환경에서 얼마나 유효하게 작동하는지를 증명하는 지표가 된다. 4라운드까지 진행된 스몰 디비전(Small Division)에서는 CAU Mountain&Sea 팀이 4전 전승을 거두며 승점 12점을 확보해 단독 선두를 달리고 있다. 이 팀은 4번의 경기 동안 단 1실점만을 기록하며 압도적인 수비 안정성을 입증했다. 뒤를 이어 함부르크 빗봇(Hamburg Bit-Bots)과 지오에이치봇(GeoHBots)이 각각 3승 1패로 2위와 3위를 기록하며 추격 중이다.

미들 디비전(Middle Division)은 상위권 팀들의 득점 생산 능력이 극명하게 갈리는 양상을 보인다. 비휴먼(B-Human) 팀은 4전 전승을 기록하며 득실차 +35라는 기록적인 수치를 달성해 선두를 굳혔다. 비휴먼의 뒤를 이어 HTWK 로봇(HTWK Robots), 로반(Rhoban), 월윈드 암스테르담(whIRLwind Amsterdam), THMOS 등 4개 팀이 승점 9점으로 공동 2위 그룹을 형성하며 치열한 순위 다툼을 벌이고 있다. 이는 미들 디비전 내에서 상위권 팀들이 하위권 팀들을 상대로 얼마나 효율적인 공격 전술을 구사하는지를 보여주는 결과다.

라지 디비전(Large Division)은 3라운드까지의 시딩 라운드를 마친 상태로, 칭화 헤파이스토스(Tsinghua Hephaestus)가 3전 전승으로 승점 9점을 획득하며 유일한 전승 팀으로 이름을 올렸다. 그 뒤를 이어 PCMS-HRG와 로보-에렉투스(Robo-Erectus)가 각각 2승 1무를 기록하며 무패 행진을 이어가고 있다. 각 디비전에서 시딩 라운드 종료 후 상위 12개 팀만이 넉아웃(Knockout) 스테이지, 즉 토너먼트 단계로 진출할 수 있다. 실전 경기 결과는 각 팀이 제출한 사전 퀄리피케이션 영상 속 성능이 실제 물리적 상호작용이 발생하는 필드에서 얼마나 일관되게 유지되는지를 판단하는 핵심 기준이 된다.

데모를 넘어 실배치 성능으로, 피지컬 AI의 검증 기준

잘 편집된 제품 시연 영상과 실제 사용 경험이 다른 경우는 흔하다. 화려한 기능이 영상에서는 매끄럽게 작동하지만, 정작 실무에 적용하면 예상치 못한 오류로 멈추는 일이 반복된다. 이번 RoboCup 2026 휴머노이드 리그에서도 유사한 검증 과정이 나타난다. 참가 팀들은 대회 전 팀 설명서와 로봇 및 소프트웨어 정보, 그리고 퀄리피케이션(자격 심사) 영상을 제출했다. 하지만 정제된 영상은 일종의 예고편일 뿐이며, 실제 제어 성능은 경기장에서의 결과로 증명된다. 영상 속의 매끄러운 동작이 실전의 변수 속에서도 유지되는지가 핵심이다.

하드웨어의 표준화는 소프트웨어 최적화 경쟁을 가속한다. 여러 팀이 무게 35kg의 Unitree G1 플랫폼을 공통으로 사용하고 있다. 동일한 하드웨어 조건에서는 피지컬 AI(물리적 환경과 상호작용하는 인공지능)의 제어 알고리즘 효율성이 승패를 가르는 핵심 변수가 된다. 하드웨어 스펙의 차이를 넘어, 주어진 물리적 한계 내에서 얼마나 정밀하게 균형을 잡고 공을 처리하는지가 실질적인 기술력의 척도가 된다. 이는 하드웨어 제조 능력이 아닌, 로봇을 움직이는 두뇌인 소프트웨어의 최적화 수준을 직접 비교할 수 있는 환경을 제공한다.

물리적 상호작용의 한계는 안전 사고를 통한 페널티로 드러난다. 대회 규칙에 따라 안전하지 않은 챌린지를 수행한 로봇에게는 옐로카드가 부여된다. 옐로카드를 2회 누적하면 레드카드를 받고 안전상의 이유로 경기에서 즉시 제외된다. 실제로 경기 중 레드카드를 받고 퇴장당한 사례가 발생했다. 이는 시뮬레이션이나 정제된 데모에서는 보이지 않던 물리적 충돌과 제어 실패가 실전 배치 환경에서 어떻게 나타나는지를 보여주는 지표다. 물리적 접촉이 빈번한 환경에서 안전을 유지하며 임무를 수행하는 능력은 단순한 동작 구현보다 훨씬 높은 난도의 제어 기술을 요구한다.

결국 피지컬 AI의 성능은 승률과 득실차라는 수치로 수렴한다. Small 디비전의 CAU Mountain&Sea는 4전 전승과 12점 획득, 단 1실점이라는 기록을 세웠다. Middle 디비전의 B-Human은 4전 전승과 함께 득실차 +35라는 압도적인 수치를 기록했다. Large 디비전의 Tsinghua Hephaestus 역시 3전 전승으로 9점을 확보했다. 정제된 영상의 매끄러움보다 득실차와 승률 같은 실전 데이터가 로봇의 실제 제어 성능을 판단하는 가장 정확한 기준이 된다. 실전 경기 결과는 제어 주기, 센서 피드백 속도, 물리적 복원력 등이 종합적으로 작용한 최종 결과물이다.

시연 영상의 매끄러운 동작은 가능성의 영역이지만, 실제 필드 위에서의 움직임은 생존과 효율의 영역이다. 3.8kg에서 48kg에 이르는 극단적인 체급 차이를 극복하고 동일한 축구 동작을 구현해내는 과정이 피지컬 AI가 직면한 기술적 실체다.

결국 제어 알고리즘의 완성도는 정제된 데모 영상이 아니라 승률과 득실차라는 냉정한 실전 데이터로 판가름 난다. 피지컬 AI의 실제 성능을 판단하는 기준은 이제 편집된 프레임이 아닌 경기 결과표의 수치로 옮겨간다.