12시간 자율 작업으로 인간을 '후원자'로 만든 Claude 5 Fable

발표에서 확인된 핵심 사실

사용자는 그동안 "더 좋게 만들어달라"는 모호한 프롬프트를 입력하며 AI와 수십 번 씨름했다. 결과물을 조금씩 수정하며 정답에 다가가는 반복 작업은 개발자의 시간을 가장 많이 뺏는 요소였다. 이번 얼리 액세스(Early Access)를 통해 공개된 최초의 미소스(Mythos)급 AI 모델인 클로드 5 페이블(Claude 5 Fable)은 이 과정을 생략한다. 다중 페이지로 구성된 상세 명세를 입력받으면 최대 12시간 동안 스스로 작업을 수행하며, 기존에 공개된 거의 모든 모델을 상당한 격차로 능가하는 성능을 기록했다.

실제로 19페이지 분량의 복잡한 설계 문서가 입력되었을 때, 클로드 5 페이블은 9시간 30분 동안 독자적으로 소프트웨어를 개발했다. 결과물은 모델이 직접 이름을 붙인 '콘코드(Concord)'라는 도구로, 다중 데이터셋을 입력받아 인간과 AI 응답을 보정하고 복잡한 데이터 분석을 수행한다. 이는 연구자들이 필요로 했으나 수익성 문제로 시장에서 구현되지 않았던 기능들을 AI가 스스로 메운 사례다.

이제 챗봇 수준을 넘어 설계서 기반의 자율 소프트웨어 개발이 가능해졌다. 사람이 직접 붙잡고 있던 작업 시간이 12시간의 자율 수행 시간으로 대체됨에 따라, 개발 생산성 지표가 응답 속도에서 자율 작업의 완결성으로 바뀐다.

기술이 실제로 작동하는 방식

Claude 5 Fable은 하위 모델을 직접 실행해 연구와 코딩, 검증 작업을 분담하는 에이전트 방식으로 작동한다. 주로 비용 효율적인 Claude Sonnet을 구동해 2,200건 이상의 항공편과 철도 시간표, 국가별 도로 속도 데이터를 수집한다. 수집된 결과물은 적대적 에이전트 그룹(adversarial groups) 워크플로를 통해 서로의 오류를 찾아내고 상호 검증한다. 모델이 스스로 연구원을 고용하고 검토자를 배치하는 오케스트레이션 구조를 구현한 결과다.

다만 고성능 자율 작업에는 높은 비용과 엄격한 통제 장치가 따른다. 토큰 소모 속도가 매우 빠르며 비용은 Opus 대비 2배 수준이다. 보안 가드레일 역시 까다로워 사이버보안 관련 문제의 미세한 징후만 포착되어도 즉시 성능이 낮은 Claude 4.8 Opus로 강제 전환된다. 이러한 전환은 작업의 연속성과 효율에 제약을 준다.

따라서 기업은 자율 소프트웨어 개발과 데이터 분석 자동화 도입 시, 고성능 모델의 자율성을 확보하는 대가로 지불해야 할 토큰 비용과 보안 통제 가능성을 핵심 판단 기준으로 계산해야 한다.

확인해야 할 핵심 지점

Claude 5 Fable은 단일 프롬프트와 한 차례의 피드백만으로 정교한 사회과학 논문을 작성했다. 모든 단어가 s로 시작해야 한다는 제약을 가진 10페이지 분량의 운율시를 생성했으며, 이미지 생성 기능 없이 수학 연산만으로 아트와 3D 오브젝트를 구현했다. 또한 외부 에셋을 전혀 사용하지 않고 실제 플레이 가능한 게임들을 제작했다.

작업의 주도권이 모델로 넘어가면서 사용자는 야심 찬 지시를 내리고 최종 결과물을 판정하는 후원자(patron)의 위치로 이동한다. 모델이 최적의 결과물을 내기 위해 내부적으로 수행하는 수백 개의 판단 과정은 사용자에게 노출되지 않는 블랙박스 형태로 작동한다.

모델의 능력이 강화될수록 인간이 작업 과정에 직접 개입할 여지는 줄어든다. 의사결정 과정이 불투명해짐에 따라 인간의 역할은 지시와 판정으로 축소되며, 결과값의 수용 여부만 결정하게 된다.

AI가 스스로 실행하는 시대에 인간의 유일한 권한은 결과물의 수용 여부를 결정하는 승인권으로 좁혀진다.

12시간 자율 작업으로 인간을 '후원자'로 만든 Claude 5 Fable

발표에서 확인된 핵심 사실

기술이 실제로 작동하는 방식

확인해야 할 핵심 지점

관련 기사