레거시 마이그레이션의 고통과 공수 산정 기준의 붕괴
수만 줄의 레거시 코드를 일일이 수정해야 하는 마이그레이션은 엔지니어링 팀의 리소스를 가장 많이 소모하는 고통스러운 작업이다. 스트라이프(Stripe)는 5,000만 라인 규모의 루비(Ruby) 코드베이스 마이그레이션을 클로드 페이블 5(Claude Fable 5)를 통해 단 하루 만에 완료했다. 해당 작업은 숙련된 엔지니어 팀이 수작업으로 진행했을 때 2개월 이상 소요되는 분량이다. 앤스로픽은 이 사례를 통해 엔지니어링 투입 공수 산정 기준을 '개월' 단위에서 '일' 단위로 단축할 수 있음을 증명했다. 페이블 5는 코그니션(Cognition)의 프론티어코드(FrontierCode) 평가에서도 고품질의 유지보수 가능한 에이전트 코딩 능력을 선보이며 프론티어 모델 중 최고 점수를 기록했다.
지속적 메모리와 비전 하네스를 통한 자율 작업력 강화
페이블 5는 파일 기반의 지속적 메모리(Persistent file-based memory)를 도입해 수백만 토큰의 긴 작업 흐름 속에서도 집중력을 유지한다. 앤스로픽이 덱 빌딩 게임 '슬레이 더 스파이어(Slay the Spire)'로 테스트한 결과, 페이블 5는 오퍼스 4.8(Opus 4.8) 대비 3배 높은 성능을 기록했으며 최종 막 도달 확률 또한 3배 증가했다. 지식 노동 분야에서는 헤비아 파이낸스 벤치마크(Hebbia Finance Benchmark)의 시니어 수준 추론 테스트에서 전체 모델 중 1위를 차지하며 문서 기반 추론과 차트 해석 능력을 입증했다. IMC는 페이블 5가 사실 조회, 개념 추론, 근본 원인 분석, 기대 가치 분석을 포함한 트레이딩 분석 평가를 전 영역에서 통과했다고 밝혔다. 비전 능력 또한 강화되어 최소한의 비전 전용 하네스(Vision-only harness)만으로 포켓몬스터 파이어레드(Pokémon FireRed)를 플레이했으며, 웹 앱의 스크린샷만으로 소스 코드를 재구현하는 정밀한 시각적 추론 능력을 구현했다.
미토스 5가 견인하는 신약 설계 및 분자 생물학의 가속화
클로드 미토스 5(Claude Mythos 5)는 단백질 설계 전문가의 약물 설계 프로세스를 약 10배 가속화했다. 모델은 인간의 도움 없이 결합 부위 선정, 설계 도구 실행, 오류 복구 작업을 스스로 수행하며 14개 타겟 중 9개에서 유효한 신약 설계 후보 물질을 도출했다. 분자 생물학 분야에서는 과학자들이 오퍼스급 모델보다 미토스 5가 제시한 가설을 약 80% 더 선호하는 결과를 보였다. 특히 미토스 5가 도출한 대장균 단백질의 새로운 메커니즘 가설은 독립적으로 연구를 진행하던 외부 연구실의 결과와 일치하며 과학적 타당성을 입증했다. 이는 AI가 단순한 문헌 요약을 넘어 실제 실험으로 이어질 수 있는 독창적인 과학적 가설을 생성하는 단계에 진입했음을 의미한다.
100배 작은 모델로 달성한 자율 유전학 연구 성과
미토스 5는 일주일간의 자율 작업을 통해 138종의 동물 종에 걸친 수백만 개의 단일 세포 데이터를 분석하는 유전학 연구를 수행했다. 모델은 서로 멀리 떨어진 종 사이에서 동일한 역할을 수행하는 세포를 식별하기 위한 맞춤형 머신러닝 모델을 직접 설계하고 학습시켰다. 이 결과물은 학술지 사이언스(Science)에 게재된 최신 모델보다 뛰어난 성능을 보였으며, 모델 크기는 해당 모델의 100분의 1 수준에 불과했다. 앤스로픽은 고도의 전문 지식 노동이 필요한 유전학 연구 영역에서 모델의 효율성과 자율성이 인간 전문가의 보조 도구를 넘어 독립적인 연구 수행 가능성을 보여주었다고 평가하며, 관련 결과를 향후 몇 달 내에 공식 발표할 계획이다.
시장 진입 장벽을 낮춘 가격 전략과 다층적 안전장치
앤스로픽은 페이블 5와 미토스 5의 가격을 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로 책정했다. 이는 이전 모델인 클로드 미토스 프리뷰(Claude Mythos Preview) 대비 50% 이상 낮은 가격으로, 기업의 AI 에이전트 도입 비용 부담을 획기적으로 낮췄다. 안전성을 위해 사이버 보안 등 위험 쿼리가 감지되면 응답 권한을 하위 모델인 오퍼스 4.8로 자동 이관하는 세이프가드를 적용했다. 세션당 평균 오탐률은 5% 미만으로 유지되며, 보수적인 튜닝을 통해 오남용 위험을 최소화했다. 미토스 5는 미국 정부와의 협력 프로젝트인 프로젝트 글래스윙(Project Glasswing)을 통해 우선 배포되어 국가 기반 시설의 보안을 강화하며, 향후 신뢰할 수 있는 액세스 프로그램을 통해 공급 범위를 점진적으로 확대할 예정이다.




