"s a catch. There"
AI 트레이닝 스타트업 Shift가 뉴욕 시민들의 집을 무료로 청소해주겠다고 제안하며 언급한 문구다. 런던 등 다른 도시로의 확장 계획까지 포함된 이 파격적인 제안은 가사 노동의 고단함을 아는 이들에게 충분히 매력적으로 다가온다. 하지만 이 서비스의 본질은 복지나 마케팅이 아니라 철저한 데이터 거래에 있다.
최근 AI 기업들은 텍스트와 이미지를 넘어 실제 물리 세계의 움직임을 학습시키기 위한 '행동 데이터' 확보에 사활을 걸고 있다. Shift의 이번 행보는 단순한 서비스 제공을 넘어, 일반인의 실제 주거 공간에서 벌어지는 가사 노동이라는 희소 데이터를 직접 수집하겠다는 전략이다. 사용자가 누리는 무료 청소의 편익은 기업이 가져갈 데이터의 가치와 맞교환되는 셈이다.
이러한 데이터 수집 방식은 기존의 크라우드 소싱 플랫폼을 통한 단순 라벨링 작업과는 궤를 달리한다. 실제 생활 환경에서 발생하는 자연스러운 움직임과 도구 사용법을 영상으로 확보함으로써, AI가 물리적 환경을 더 정확하게 이해하도록 만드는 것이 핵심이다.
Shift의 뉴욕 무료 청소 서비스와 글로벌 확장 계획
AI 모델이 인간의 일상적인 가사 노동을 완벽하게 모사하기 위해 필요한 것은 무엇일까. 대다수 기업이 간과하는 지점은 정제된 텍스트 데이터가 아니라, 실제 가정 내에서 벌어지는 복잡하고 비정형적인 물리적 움직임에 대한 방대한 영상 데이터의 부재다. 인공지능 트레이닝 스타트업인 Shift는 이 간극을 메우기 위해 뉴욕 시민을 대상으로 무료 집 청소 서비스를 제공하기 시작했다. 이들은 청소 인력을 파견해 주거 공간을 정리해 주는 대가로 가사 노동 과정이 담긴 영상 데이터를 확보한다. 단순히 청소 대행업을 영위하는 것이 아니라, AI 학습을 위한 고품질 데이터를 수집하는 것이 이들의 주된 사업 목적이다.
Shift는 뉴욕에서 시작한 이번 프로젝트를 발판 삼아 글로벌 확장을 준비하고 있다. 이미 런던을 포함한 주요 도시로 서비스 지역을 넓히겠다는 계획을 구체화했다. 무료 서비스라는 파격적인 조건을 내건 이유는 데이터 확보의 난이도 때문이다. 가정 내 사생활이 포함된 일상적인 움직임은 일반적인 데이터 크롤링 방식으로는 수집이 불가능하다. 이들은 합법적인 계약을 통해 가사 노동 현장을 영상으로 기록하고, 이를 AI 모델의 시각적 지능을 높이는 학습 자료로 활용한다. 서비스 이용자는 무료 청소라는 실질적인 혜택을 얻고, 기업은 시장에서 구하기 어려운 독점적 학습 데이터를 확보하는 구조다.
가사 노동 영상은 AI가 물리적 세계를 이해하는 데 핵심적인 역할을 한다. 로봇 공학이나 가정용 AI 에이전트가 사람의 지시를 수행하려면 물건을 집거나 정리하는 동작의 미세한 각도와 힘의 분배를 학습해야 한다. Shift는 이러한 데이터를 체계적으로 수집하여 인공지능이 인간의 주거 환경에 적응하도록 돕는 인프라를 구축한다. 뉴욕의 각 가구에서 수집된 영상은 데이터셋으로 가공되어 향후 다양한 자동화 기술의 기반이 될 예정이다. 무료 서비스라는 외형 뒤에는 데이터 주도권을 확보하려는 이들의 전략적 계산이 깔려 있다.
가사 노동 영상 데이터가 AI 모델에 미치는 영향
거실과 주방을 청소해 주는 서비스가 비용 없이 제공된다면 대부분의 사용자는 이를 긍정적으로 받아들인다. AI 학습 스타트업 시프트(Shift, 가사 노동 데이터 수집 기업)는 뉴욕 시민들의 집을 무료로 청소해 주겠다고 밝혔다. 이들은 뉴욕을 시작으로 런던 등 다른 도시로 서비스 지역을 확장할 계획이다. 무료 서비스의 대가는 거주 공간 내에서 가사 노동이 수행되는 과정이 담긴 영상 데이터다. 사용자는 비용 지불 대신 자신의 사적 공간에서 일어나는 행동 기록을 제공하는 조건으로 서비스를 이용한다.
수집 대상은 실제 사람이 거주하는 공간에서 일어나는 구체적인 움직임과 작업 과정이다. 그동안 AI 모델 학습에 쓰인 데이터는 주로 웹상의 텍스트나 정적인 이미지, 혹은 통제된 시뮬레이션 환경의 영상에 집중되었다. 시프트가 수집하는 데이터는 실제 물리적 환경에서 도구를 쥐는 방식, 물건을 옮기는 궤적, 공간의 구조에 따른 이동 경로를 포함한다. 텍스트 기반의 지식 학습을 넘어 물리적 세계의 상호작용 방식을 직접 학습하려는 시도다.
데이터 수집 방식은 서비스 제공과 데이터 제공을 맞교환하는 바터(Barter, 물물교환) 형태를 띤다. 사용자는 청소 서비스라는 실질적인 편익을 얻고, 기업은 학습에 필요한 고품질의 행동 데이터를 확보한다. 이는 고가의 센서를 설치하거나 인위적인 실험실 환경을 구축하는 대신 실제 생활 현장에서 데이터를 직접 추출하는 방식이다. 데이터 확보에 드는 현금 비용을 서비스 제공 비용으로 대체하며 수집 효율을 높였다.
개발자 관점에서 이러한 데이터는 로봇 제어 모델의 정밀도를 높이는 핵심 요소가 된다. 가사 노동 영상에는 물체의 재질, 가구의 배치, 작업의 선후 관계 등 정형화되지 않은 변수가 모두 포함되어 있다. 시뮬레이션 데이터가 해결하지 못한 엣지 케이스(Edge Case, 예외적인 상황)를 실제 영상 데이터로 보완하는 구조다. 실제 환경의 행동 데이터가 AI 모델의 물리적 실행 능력을 결정하는 실질적인 변수로 작용한다.
학습 데이터의 성격이 디지털 텍스트에서 물리적 행동으로 이동하는 지점이다. 기존의 대규모 언어 모델이 인터넷의 텍스트를 통해 세상의 논리를 배웠다면, 이제는 실제 공간의 영상을 통해 세상의 물리 법칙을 배운다. 거주 공간이라는 비정형 환경에서 수집된 데이터는 AI가 예측 불가능한 상황에 대응하는 능력을 키우는 기반이 된다. 데이터의 양보다 실제 환경의 복잡성을 얼마나 담아냈느냐가 모델의 성능을 가르는 기준이 된다.
Shift는 무료 청소 서비스의 대가로 일상 영상을 수집하며 AI 학습 데이터의 확보 경로를 다각화했다. 이는 단순한 편의 제공을 넘어 사용자의 실생활 데이터를 직접적으로 자본화하려는 전략이다. 데이터 확보를 위한 비용 지불 방식이 기존의 현금 결제에서 서비스 교환 방식으로 전환되는 흐름을 보여준다. 결국 AI 모델의 경쟁력은 정제된 데이터의 확보량과 이를 이끌어내기 위한 교환 가치의 설계 능력이 결정한다.




