제너럴 인튜이션, 3억 2000만 달러 투자 유치와 게임 데이터 활용 전략
로봇이 현실의 복잡한 환경에서 물건을 집거나 이동할 때 서툰 움직임을 보이는 이유는 학습 데이터가 부족하기 때문이다. 제너럴 인튜이션은 이 문제를 해결하기 위해 게임 클립 공유 플랫폼 메달(Medal)의 수십억 개 영상 데이터를 로봇 훈련에 도입했다.
제너럴 인튜이션 미국 법인은 최근 3억 2000만 달러(약 4922억원) 규모의 시리즈 A 투자를 유치했다. 이번 투자로 기업 가치는 23억 달러(약 3조 5000억원)로 평가받았으며, 총 누적 투자 금액은 4억 5400만 달러(약 7000억원)에 달한다. 제너럴 카탈리스트가 이번 라운드를 주도했으며 제프 베이조스와 에릭 슈미트 전 구글 CEO가 참여했다.
이 회사는 게임 영상에 담긴 인간의 환경 인지와 움직임 결정 과정을 물리적 AI 훈련에 활용한다. 이는 텍스트 기반 모델이 제공하는 현실 묘사만으로는 물리적 AI를 훈련시키기에 불충분하다는 판단에 따른 것이다.
확보한 투자금은 컴퓨팅 용량 확장과 차세대 모델의 사전훈련에 사용한다. 올해 여름 중에는 소프트웨어 간 통신 규약인 API(애플리케이션 프로그램 인터페이스)를 더 널리 제공할 계획이다.
이러한 데이터 전략의 핵심은 게임 영상 속에 숨겨진 '행동 데이터'를 추출해 로봇의 지능으로 변환하는 기술에 있다.
행동 라벨링과 세계 모델: 게임 영상이 로봇 뇌가 되는 원리
메달 플랫폼의 영상 데이터에는 플레이어가 어떤 버튼을 언제 눌렀는지 기록한 행동 라벨(Action Label)이 내장되어 있다. 로봇은 단순한 화면 변화를 보는 것이 아니라 버튼 입력과 결과 사이의 인과관계를 학습한다.
제너럴 인튜이션은 2015년부터 행동 모델(Action Model)과 세계 모델(World Model)을 개발했다. 행동 모델은 특정 상황에서 취할 동작을 결정하고, 세계 모델은 그 동작 이후에 벌어질 결과를 예측한다. 로봇은 이 두 모델을 통해 인지하고 예측하며 즉흥적으로 대처하는 능력을 갖춘다.
수천 시간의 실제 데이터를 수집하거나 시뮬레이션을 생성하는 기존 방식은 비용 부담이 크다. 반면 이미 구축된 대규모 행동 데이터를 확보하는 방식은 물리적 AI의 학습 효율을 높이는 대안이 된다.
물리적 AI의 경쟁력은 단순한 시각 정보의 양보다 의사결정 과정이 담긴 행동 라벨의 정교한 확보 여부에 달려 있다. 이러한 데이터 확보 경로의 실효성이 로봇 학습의 경제성을 결정하는 핵심 요소가 될 전망이다.




