200시간 걸릴 로봇 테스트를 30분 만에 끝내는 Genesis World 1.0

45%.

Genesis AI가 공개한 Genesis World 1.0은 기존의 가장 뛰어난 시뮬레이터보다 실제 환경과의 격차를 45%나 더 줄였습니다. 정교한 비행 시뮬레이터로 훈련받은 조종사가 실제 조종석에서도 당황하지 않고 기체를 다루는 것과 비슷합니다. 가상 세계에서 일어난 일이 현실에서도 거의 그대로 재현된다는 뜻입니다.

이번 발표의 핵심은 '속도'에 있습니다. 그동안 로봇 AI 개발 팀은 모델을 수정할 때마다 실제 로봇을 수백 시간 동안 구동하며 성능을 확인해야 했습니다. 사람이 옆에서 계속 지켜봐야 하는 이 과정은 전체 개발 속도를 늦추는 가장 큰 병목이었습니다. Genesis AI는 현실에서 200시간이 넘게 걸릴 평가 작업을 단 30분 만에 끝낼 수 있는 환경을 구축해, 하드웨어 없이 소프트웨어만으로 모델의 우열을 가릴 수 있게 했습니다.

물리 엔진부터 컴파일러까지, Genesis World 1.0의 4가지 구성 요소

Genesis World 1.0은 실제 하드웨어 기반의 데이터 수집 대신 가상 세계의 대규모 병렬 연산으로 검증 속도를 높였다. 시스템은 크게 네 가지 요소로 구성된다.

Genesis World 물리 엔진은 Apache 2.0 라이선스로 공개된 오픈소스 소프트웨어다. 강체(MJCF/URDF/USD), 탄성체(FEM), 입자(MPM), 유체(SPH) 및 빠른 연산용 액체(PBD)를 모두 지원하며, 하나의 파이프라인에서 서로 다른 성질의 물질을 동시에 계산할 수 있다. 특히 일반 목적용, Drake 스타일의 반분석적 프라이멀(Semi-Analytic Primal), 교차 없는 접촉을 보장하는 IPC(Incremental Potential Contact)라는 세 가지 커플러를 제공해 연산 방식을 한 줄의 코드로 변경할 수 있다.

시각적 구현은 Nyx라는 실시간 경로 추적 렌더러가 담당한다. `gs-nyx-plugin`이라는 파이썬 패키지로 제공되며 NVIDIA GPU와 CUDA 환경이 필요하다. 빛이 물체에 부딪혀 튕겨 나가는 경로를 계산하는 경로 추적 방식을 사용해 그림자와 반사광을 실제처럼 구현한다.

연산 속도를 높이는 핵심은 Quadrants 컴파일러다. 파이썬 코드를 NVIDIA CUDA, AMD ROCm, Apple Metal, Vulkan 같은 GPU 전용 언어로 변환한다. 2025년 6월 Taichi에서 포크되어 Apache 2.0으로 공개되었으며, 물리 단계들을 하나의 커널 그래프로 기록해 실행 지연을 없앴다.

마지막으로 시뮬레이션 인터페이스가 이 모든 도구를 통합한다. 포토그래메트리 파이프라인을 통해 정교한 디지털 트윈을 제작하며, 장면 배치부터 자산 선택, 작업 사양 및 성공 지표 설정까지 자동화하는 환경 생성 도구를 포함한다. 개발자는 복잡한 설정 없이 로봇의 외형과 환경만 지정해 테스트에 들어갈 수 있으며, 여러 로봇 설정이 섞인 교차 Embodiment 환경에서도 일관된 인터페이스를 사용한다.

빛의 경로를 추적하는 Nyx와 GPU 최적화 컴파일러 Quadrants의 작동 원리

Nyx는 사전 계산 과정 없이 1080p 해상도의 화면을 4ms 안에 그려낸다. 가시성 버퍼(Visibility Buffer)로 렌더링 대상만 골라내고, 하드웨어 레이 트레이싱으로 실제 빛의 반사를 구현했다. 여기에 HDRI 파이프라인과 3D 가우시안 스플래팅(3D Gaussian Splats) 기술을 더해 시각적 정확도를 높였다. 특히 수천 개의 서로 다른 시나리오를 하나의 렌더링 파이프라인에 묶어 처리하는 배치 물리 구동 방식을 사용해, 개별 장면을 따로 불러올 때 발생하는 병목 현상을 제거했다.

Quadrants 컴파일러는 물리 연산 단계를 개별적으로 실행하지 않고, 전체 계산 과정을 단일 커널 그래프로 기록해 한 번에 실행함으로써 GPU의 실행 지연 시간을 없앴다. 행렬 계산 같은 복잡한 수학 처리는 16x16 타일 블록 경로로 컴파일해 처리 속도를 높였다. 또한 DLPack 표준 형식을 사용해 PyTorch와 메모리를 공유하는 제로 카피(Zero-copy) 방식을 적용, 데이터 복사 과정 없이 즉시 연산한다. 이러한 최적화로 로봇 조작 및 보행 벤치마크에서 기존 Taichi보다 최대 4.6배 빠른 실행 속도를 기록했으며, `single_franka_envs.py`의 초기 구동 시간은 7.2초에서 0.3초로 단축되었다.

200시간의 물리적 한계를 0.5시간의 연산으로 대체한 성능 차이

보통의 로봇 개발 팀은 단 한 번의 성능 평가 주기를 위해 로봇 한 대와 운영자 한 명을 붙여 200시간 넘게 기계를 돌려야 한다. 제네시스 월드 1.0은 이 과정을 0.5시간 미만의 연산으로 줄여 평가 속도를 400배 이상 끌어올렸다.

가상 환경의 신뢰성을 검증하기 위해 Small, Medium, Large 세 가지 모델 변체로 14가지 작업에 대해 각 200회씩 에피소드를 실행한 결과, 시뮬레이션과 실제 하드웨어 결과 사이의 피어슨 상관계수 0.8996을 기록했다. 모델의 상대적 성능 순위 유지력을 측정하는 SimplerEnv의 MMRV(평균 최대 순위 위반) 지표는 0.0166으로 나타났다. 이는 시뮬레이션에서 우수한 성능을 보인 모델이 실제 로봇에서도 동일하게 작동한다는 데이터의 일관성을 입증한다.

물체끼리 부딪히는 접촉이 빈번한 장면에서는 새로운 솔버(Solver)를 도입해 기존의 IPC 방식보다 최대 1,000배 빠른 성능을 냈다. 복잡한 물리 충돌 계산 시간을 획기적으로 줄여 수천 개의 시나리오를 동시에 돌릴 수 있는 연산 기반을 마련했다.

'제로샷 리얼-투-심' 전략을 통한 학습과 평가의 분리

제네시스 AI는 학습과 평가의 경계를 명확히 하기 위해 '제로샷 리얼-투-심(Zero-shot real-to-sim)' 전략을 도입했다. 실제 환경에서 수집한 데이터로만 로봇을 학습시키고, 가상 시뮬레이션 공간에서는 오직 성능 평가만 수행하는 방식이다. 학습 데이터에 시뮬레이션 데이터를 섞지 않음으로써 모델이 시뮬레이터 특유의 물리 법칙이나 오차에 최적화되는 과적합 문제를 해결했다. 이를 통해 시뮬레이션에서의 성능 향상이 실제 로봇의 지능 개선으로 이어지는지 명확하게 구분할 수 있다.

검증 과정에서는 10가지 차원의 섭동(Perturbation) 축을 설정해 모델의 강건성을 측정한다. 물체의 무게나 표면 마찰력 같은 변수를 하나씩 바꿔가며 수천 번의 테스트를 반복해, 어떤 돌발 상황에서도 작업을 완수하는지 수치화한다. 이는 모델이 어떤 환경 변수에 취약한지 한계 지점을 정확히 짚어내는 작업이다.

오차 원인을 찾기 위해 시뮬레이터와 실제 로봇을 동시에 구동하며 비교하는 사이드-바이-사이드 리그(Side-by-side rig)를 활용한다. 카메라 영상이나 관절 상태 데이터를 서로 교체하거나 섞어 입력함으로써, 오차가 물리 엔진의 계산 실수인지, 렌더링 문제인지, 혹은 제어 신호의 지연 때문인지 개별적으로 격리해 제거한다.

한국 로봇 AI 실무자가 주목해야 할 하드웨어 비용 절감과 개발 주기

실제 환경에서 모델을 평가하려면 전용 로봇 스테이션과 전담 운영 인력이 필요하며, 이는 막대한 인건비와 공간 비용으로 이어진다. 제네시스 월드 1.0은 이 과정을 GPU 서버 연산으로 대체해 비용 구조를 효율화했다. 사람이 직접 감시하지 않고도 30분 안에 동일 규모의 평가를 끝낼 수 있다.

개발 실무자는 모델 체크포인트(학습 단계별 저장 지점)를 비교하는 빈도를 획기적으로 늘릴 수 있다. 기존에는 테스트 사이클 때문에 모델 수정 후 확인까지 며칠이 걸렸으나, 이제는 30분 단위로 결과를 뽑아내어 다양한 하이퍼파라미터 후보군을 빠르게 검증한다. 특히 실행 시마다 결과가 비트 단위로 일치하므로, 성능 향상이 우연이 아닌 모델 개선의 결과임을 명확히 구분할 수 있다.

또한 URDF(로봇 외형/관절 표준 파일)와 MuJoCo 액추에이터 같은 업계 표준 자산을 그대로 지원하며, 복합 관절이나 미믹 조인트 설정까지 포함한다. 특정 제조사의 장비나 폐쇄적 소프트웨어에 종속되지 않고 이미 보유한 로봇 설계도를 즉시 적용할 수 있다. 이는 고가의 장비를 대량 구매하기 어려운 국내 로봇 산업 현장에서 개발 진입 장벽을 낮추는 실질적인 도구가 된다.

200시간의 물리적 테스트가 30분의 디지털 연산으로 압축되었다. 로봇이 현실 세계에서 수만 번 넘어지며 몸소 배울 시간을 가상 세계의 데이터 처리로 순식간에 대체한 결과다. 물리적 제약으로 인한 시행착오의 비용이 사라진 자리에는 더 과감한 실험과 빠른 업데이트가 들어선다.

이제 로봇의 완성도를 결정하는 것은 기계적인 정밀함보다 가상 세계를 얼마나 실제와 똑같이 구현하느냐에 달려 있다. 결국 시뮬레이션의 효율성이 로봇의 진화 속도를 결정한다.