실리콘밸리 스타트업 휴먼 아카이브(Human Archive)가 인도 긱 경제(Gig Economy, 단기 계약직 중심의 노동 시장) 종사자들을 통해 로봇 학습용 1인칭 시점(Egocentric) 데이터를 수집하고 있다. 이들은 가사 서비스, 호텔, 레스토랑 분야의 파트너사와 협력해 작업자가 카메라가 달린 특수 캡을 착용하게 함으로써 일상적인 작업 수행 과정을 영상으로 기록한다.
최근 휴먼 아카이브는 윙 벤처 캐피털(Wing Venture Capital)과 Y 콤비네이터(Y Combinator) 등을 포함해 OpenAI, 엔비디아(Nvidia), 구글(Google) 출신 엔젤 투자자들로부터 820만 달러의 자금을 조달했다. 물리적 세계에서 실제 작업을 수행하는 로봇을 개발하려는 AI 기업들이 직면한 가장 큰 병목 현상은 인간이 어떻게 움직이고 작업하는지를 보여주는 고품질 데이터의 부족이다. 휴먼 아카이브는 인도의 거대한 긱 워커 네트워크를 이 데이터 갈증을 해결할 확장 가능한 공급원으로 보고 사업을 전개하고 있다.
핵심 변화
인도의 가사 서비스나 호텔, 레스토랑에서 일하는 노동자들이 카메라가 달린 특수 캡을 쓰고 평소처럼 업무를 수행한다. 실리콘밸리 스타트업 휴먼 아카이브(Human Archive)가 실제 세계에서 물리적 작업을 수행하는 로봇을 훈련시키기 위해 1인칭 시점(egocentric, 사람이 보는 방향 그대로를 기록하는 방식) 데이터를 수집하는 장면이다. 쉽게 말하면 로봇이 배워야 할 동작의 정답지가 담긴 교과서를 만들기 위해 숙련된 사람의 시야를 그대로 복사하는 과정이다. 이는 로봇 학습에 필수적인 고품질 데이터가 턱없이 부족한 현재의 기술적 한계를 정면으로 돌파하려는 전략이다.
데이터를 확보하는 과정에서는 고객의 선택권을 활용한 정교한 인센티브 구조가 작동한다. 휴먼 아카이브는 소규모 스타트업들과 협력하여 전용 앱을 통해 고객에게 두 가지 결제 옵션을 제안한다. 데이터 수집에 동의하면 서비스 요금을 할인해주고, 동의하지 않으면 정가를 지불하게 하는 방식이다. 비유하자면 데이터 제공의 대가로 이용료를 깎아주는 일종의 바터 거래와 비슷하며, 고객들은 비용 절감뿐 아니라 영상 기록이 서비스 품질 분쟁을 해결하는 명확한 증거가 된다는 점 때문에 할인 옵션을 선호하는 경향이 있다.
이러한 데이터 수집 모델은 글로벌 투자 시장에서도 빠르게 주목받았다. 휴먼 아카이브는 윙 벤처 캐피털(Wing Venture Capital), NVP 캐피털(NVP Capital), Y 콤비네이터(Y Combinator)로부터 총 820만 달러의 투자를 유치했다. 주목할 점은 단순 벤처 캐피털뿐 아니라 오픈에이아이(OpenAI), 엔비디아(Nvidia), 구글(Google), 메타(Meta) 등 주요 AI 기업의 엔젤 투자자들이 대거 참여했다는 사실이다. 이는 실제 환경의 데이터를 확보하는 것이 차세대 로봇 지능 구현의 핵심 열쇠라는 점에 업계가 동의하고 있음을 보여준다.
기존과의 차이
로보틱스 연구소와 프론티어 AI 기업들이 실제 환경에서 작동하는 기계를 구축하려 하지만 정작 인간이 일상 업무를 수행하는 고품질의 실제 훈련 데이터가 부족해 심각한 병목 현상을 겪고 있다. 기계가 사람처럼 자연스럽게 움직이려면 수많은 실제 사례가 필요하지만 이를 대량으로 확보하는 것이 어렵기 때문이다. 휴먼 아카이브(Human Archive)는 인도의 급성장하는 긱 경제(Gig Economy, 필요할 때마다 단기로 계약해 일하는 경제 형태) 노동력을 이 데이터의 확장 가능한 원천으로 보고 베팅하고 있다.
기존의 데이터 수집이 단순히 영상을 찍어 기록하는 수준이었다면 휴먼 아카이브는 촉각 장갑과 전신 모션 캡처 수트, 손목 카메라 등을 활용해 동기화된 멀티모달(Multimodal, 텍스트나 이미지 등 여러 형태의 정보를 함께 처리하는 방식) 데이터를 수집한다. 쉽게 말하면 눈으로 보는 영상뿐만 아니라 손끝에 느껴지는 압력과 몸의 세밀한 움직임까지 한꺼번에 기록하는 방식이다. 비유하자면 요리 영상을 단순히 시청하는 것과 요리사가 재료를 쥐는 힘과 팔의 각도를 그대로 복제해 가져오는 것의 차이라고 할 수 있다. 이를 위해 이들은 RGB-D(색상 정보와 깊이 정보를 동시에 담은 이미지) 이미지와 촉각 힘(tactile force), 동작 데이터를 동시에 캡처하는 커스텀 하드웨어를 직접 개발해 AI 랩에 판매한다. 영상 데이터만으로는 로봇을 학습시키기에 부족하며 다양한 센서 데이터가 결합되어야 데이터의 가치가 비약적으로 높아진다고 판단했기 때문이다.
데이터 수집의 기술적 접근뿐만 아니라 비용 구조에서도 경쟁사와 뚜렷한 차이를 보인다. 휴먼 아카이브는 데이터 수집 참여 노동자에게 시간당 1달러의 기본 수당을 지급하고 있는데 이는 업계의 다른 기업들과 비교해 낮은 수준이다. 이코노믹 타임스(Economic Times)의 보고서에 따르면 다른 경쟁 기업들은 시간당 약 2.63~4.20달러(250~400루피)를 지급하고 있는 것으로 나타났다. 휴먼 아카이브의 CEO는 인도 현지에 진출해 인프라를 구축함으로써 보상 비용을 효율적으로 낮게 유지할 수 있다고 설명했다.




