2026년 7월 30일부터 신규 고객 유치를 중단한다

AI 학습을 위해 사진 속 사물을 일일이 표시하고 문장의 감정을 분류한다. 단순 반복 작업에 수만 명의 사람이 동원되는 이 과정은 AI 고도화의 필수 관문이었다. 아마존 메카니컬 터크(Amazon Mechanical Turk, 크라우드소싱 기반 데이터 라벨링 서비스)가 2026년 7월 30일부터 신규 고객 가입을 중단한다.

아마존 웹 서비스(Amazon Web Services)는 공식 웹사이트 공지를 통해 신중한 검토 끝에 이번 결정을 내렸다고 밝혔다. 2026년 7월 30일 이후로는 새로운 고객이 이 크라우드소싱 서비스에 가입할 수 없다. 신규 유입 경로를 완전히 차단하는 조치다.

메카니컬 터크는 2018년부터 세이지메이커 AI(SageMaker AI, 아마존의 머신러닝 플랫폼)의 데이터 어노테이션(Annotation, 데이터 주석 처리) 도구로 활용됐다. 아마존은 기업들이 신경망(Neural Networks)을 훈련시키기 위해 데이터를 주석 처리하는 수단으로 이 서비스를 제공하고 과금해 왔다. 인간의 인지 능력을 AI 학습용 정답지로 변환하는 핵심 경로였다.

기업들은 이 도구를 통해 대규모 데이터를 빠르게 정제해 모델에 입력했다. 세이지메이커 AI 생태계 내에서 인간 작업자는 신경망의 정확도를 높이는 필수 부품으로 작동했다. 아마존은 이제 이 인간 기반의 데이터 라벨링 체제를 정리한다.

투자금과 참여 투자자가 보여주는 신호

20년 가까이 유지된 서비스가 왜 갑자기 신규 가입을 막았을까. 2005년에 출시된 Mechanical Turk는 단순 작업 수행을 위한 크라우드소싱 마켓플레이스다. 크라우드소싱 마켓플레이스는 온라인 플랫폼을 통해 불특정 다수의 대중에게 업무를 위탁하고 결과물을 얻는 시장을 의미한다. 완전한 자동화가 어려운 작업들이 주 대상이었다. 캡차(CAPTCHA, 사람과 컴퓨터를 구별하는 인증 시스템) 해결이 대표적이다. 문장의 기본 감성을 식별하는 일도 포함됐다. 작업자는 이러한 단순 작업을 수행하고 소액의 보상을 받는 구조로 운영되었다.

이미 서비스를 이용 중인 기존 고객은 평소와 다름없이 서비스를 계속 사용할 수 있다. AWS는 Mechanical Turk의 보안을 강화하는 작업에 투자를 지속한다. 서비스의 가용성을 높이기 위한 개선 작업도 계속될 예정이다. 하지만 서비스에 새로운 기능을 추가로 도입할 계획은 없다고 명시했다. 시스템 유지보수 외의 추가 개발은 진행하지 않겠다는 방침이다.

확인해야 할 핵심 지점

사람이 하던 일이 기계의 영역으로 넘어가는 시간은 생각보다 짧았다. 2023년 분석 결과 플랫폼 작업자의 33%에서 46%가 거대언어모델(Large Language Models, LLM)을 사용해 업무를 수행했다. LLM은 방대한 데이터를 학습해 인간처럼 텍스트를 생성하는 AI 모델이다. 작업자들이 AI를 도구로 쓰면서 플랫폼에서 어노테이션된 데이터의 신뢰성이 흔들렸다. 어노테이션은 AI 학습을 위해 데이터에 정답 태그를 다는 작업이다. 인간의 개입이 여전히 필요한지에 대한 의문이 제기됐다. 인간-인-더-루프(Human-in-the-loop, AI 학습 과정에 사람이 개입해 정확도를 높이는 방식)의 실효성이 사라진 셈이다.

일부 사용자들은 이미 수년 전부터 플랫폼이 사실상 종료됐다고 주장한다. 레딧(개발자 커뮤니티, 미국 커뮤니티 사이트)의 한 사용자는 봇과 사기 문제로 작업자와 연구자들이 플랫폼을 떠났다고 밝혔다. 봇을 이용한 자동화 작업과 부정행위가 데이터의 질을 떨어뜨렸다. 사용자는 이러한 현상이 지속되어 결국 서버 운영 자체가 중단될 것이라고 예측했다.

인간이 정답을 달아야 할 자리를 AI가 채우면서 데이터 오염의 가능성이 커졌다. AI가 만든 데이터를 다시 AI가 학습하는 루프는 모델의 품질을 결정하는 핵심 변수가 된다. 인간 기반 데이터 라벨링의 신뢰도 하락은 AI 학습 데이터 수집 전략의 전면적인 수정을 요구한다. 데이터의 순도가 낮아지면 AI 모델의 성능 저하로 직결된다. 신뢰할 수 없는 데이터는 AI의 지능을 퇴보시키는 요인이 된다.

작업자의 33%에서 46%가 LLM을 이용해 정답을 제출했다. 인간의 노동력에 기반한 데이터 라벨링의 신뢰도는 이미 임계점을 넘었다. 아마존의 신규 가입 중단은 이 체제의 유효기간이 끝났음을 의미한다.

이제는 AI가 만든 데이터를 다시 AI가 학습하며 지능이 퇴보하는 루프의 위험성을 판단해야 한다. 데이터의 순수성을 검증하는 기준이 AI 모델의 생존을 결정한다.