99.8%. Bun의 개발자가 클로드의 새로운 기능을 사용해 기존 테스트 코드의 거의 전부를 통과시키며 언어를 옮긴 수치입니다. 수천 페이지의 전공 서적을 다른 언어로 번역했는데, 오타나 오류가 거의 없이 완벽하게 옮겨낸 것과 비슷합니다. 그리고 이 놀라운 결과 뒤에는 AI 한 명이 아니라, 수백 명의 AI가 팀을 이뤄 일하는 '다이내믹 워크플로우'라는 새로운 방식이 있습니다.
보통 AI에게 코딩을 시키면 한 번에 하나의 답변을 내놓는 식입니다. 하지만 수만 줄의 오래된 코드를 수정하거나, 수백 개의 파일을 한꺼번에 옮겨야 하는 거대한 작업 앞에서는 AI도 한계를 보입니다. 사람이 직접 계획을 짜고, 파일을 하나하나 지정해줘야 했죠. 이제는 AI가 스스로 전체 계획을 세우고, 필요한 만큼의 보조 AI들을 생성해 작업을 나눠 갖는 시대가 왔습니다. 개발자가 '이걸 해줘'라고 던지면, AI가 내부적으로 수백 명의 팀원을 고용해 일을 끝내고 결과만 보고하는 구조입니다.
단순히 속도가 빨라진 것이 아닙니다. 작업의 단위 자체가 '질문과 답변'에서 '프로젝트 완수'로 바뀌었습니다. 분기 단위로 계획했던 대규모 리팩토링 작업이 단 며칠 만에 끝나는 경험, 그것이 이번 업데이트가 지향하는 지점입니다.
75만 줄의 코드를 11일 만에, 다이내믹 워크플로우의 실체
코드를 다른 언어로 옮기는 작업은 보통 끝이 보이지 않는 지루한 싸움이다. 수만 줄의 코드를 일일이 대조하며 옮기다 보면 예상 일정보다 몇 배의 시간이 더 걸리고 휴먼 에러가 발생하기 일쑤다. 자레드 섬너는 이번에 다이내믹 워크플로우를 활용해 번(Bun) 프로젝트를 지그(Zig) 언어에서 러스트(Rust) 언어로 포팅했다. 약 75만 줄에 달하는 러스트 코드를 작성하고 첫 커밋부터 머지까지 단 11일 만에 완료했다. 기존 테스트 스위트의 99.8%를 통과하며 코드의 정확성까지 확보했다. 단순한 채팅 응답을 넘어 대규모 엔지니어링 작업을 끝까지 완수하는 자동화 체계를 실제 사례로 증명했다.
클로드는 오케스트레이션 스크립트를 직접 작성해 수십에서 수백 개의 서브에이전트를 한 세션에서 동시에 가동한다. 서브에이전트는 특정 역할만 수행하는 작은 AI 단위다. 먼저 지그 코드베이스의 모든 구조체 필드에 맞는 러스트 라이프타임(메모리 유효 기간)을 매핑하는 워크플로우를 실행했다. 그다음 수백 개의 에이전트가 병렬로 투입되어 지그 파일과 동일한 동작을 하는 러스트 파일을 하나씩 작성했다. 이때 파일 하나당 두 명의 리뷰어 에이전트가 붙어 작성된 코드를 꼼꼼하게 검수했다. 거대한 작업을 아주 작은 단위로 쪼개어 동시에 처리함으로써 사람이 수개월 걸릴 물리적인 작업 시간을 며칠 단위로 줄였다.
작업 완료 후에는 빌드와 테스트 스위트가 오류 없이 돌아갈 때까지 수정 루프를 반복했다. 포팅이 끝난 뒤에는 밤새도록 불필요한 데이터 복사 구간을 찾아내고 각각의 수정 사항을 PR(풀 리퀘스트, 코드 변경 요청)로 올리는 워크플로우를 추가로 가동했다. 진행 상황은 실시간으로 저장되어 중간에 작업이 끊겨도 처음부터 다시 시작할 필요 없이 멈춘 지점부터 즉시 이어간다. 모든 조율이 대화창 내부가 아니라 외부 시스템에서 이뤄지기에 작업 규모가 아무리 커져도 전체 계획이 흔들리지 않는다. AI가 스스로 계획을 세우고 실행하며 결과물을 다듬는 일종의 소프트웨어 공정 라인을 구축한 셈이다.
이 기능은 클로드 코드 CLI(명령줄 인터페이스)와 데스크톱, VS 코드 확장 프로그램에서 리서치 프리뷰 형태로 제공된다. 맥스(Max), 팀(Team), 엔터프라이즈(Enterprise) 플랜 사용자와 클로드 API 이용자가 바로 사용할 수 있다. 아마존 베드락(AWS AI 플랫폼), 버텍스 AI(구글 AI 플랫폼), 마이크로소프트 파운드리(MS AI 개발 환경) 등 주요 클라우드 AI 플랫폼 환경에서도 지원한다. 다만 다이내믹 워크플로우는 일반적인 세션보다 토큰 소모량이 훨씬 많으므로 처음에는 범위가 좁은 작업부터 시작하는 것이 좋다. 개발자가 도구의 제어권을 유지하면서도 대규모 인프라 작업을 AI에게 완전히 맡길 수 있는 환경이 마련됐다.
수백 명의 AI가 서로 검토하고 반박하는 '병렬 처리' 구조
개발자가 수만 줄의 레거시 코드에서 버그를 찾아달라는 요청을 보내는 순간 클로드는 곧바로 답을 내놓지 않는다. 먼저 요청 내용을 정밀하게 분석해 전체 작업 지도를 그리는 동적 계획 수립 단계에 들어간다. 거대한 작업을 수십 개 혹은 수백 개의 작은 하위 작업으로 쪼갠 뒤 이를 보조 AI인 서브에이전트들에게 동시에 배분한다. 한 명의 숙련된 개발자가 모든 파일을 일일이 읽는 대신 수백 명의 보조 인력이 각자 맡은 구역을 동시에 훑는 구조다. 이렇게 병렬로 처리하면 사람이 직접 붙잡고 며칠을 고민해야 할 분석 작업을 단 몇 시간으로 단축할 수 있다.
각 보조 AI는 서로 다른 각도에서 문제에 접근해 독립적인 해결책을 제시한다. 여기서 핵심은 서로의 결과물을 끊임없이 의심하는 검증 루프에 있다. 한 AI가 내놓은 답을 다른 AI가 검토하며 논리적 허점을 찾아내 반박하고, 다시 수정안을 내놓는 과정을 반복한다. 여러 명의 전문가가 모여 끝장 토론을 벌이며 하나의 합의된 정답으로 수렴해가는 과정과 같다. 단 한 번의 추론으로 답을 내는 일반적인 방식으로는 도달하기 힘든 높은 정확도를 이 치열한 상호 검증 과정을 통해 확보한다.
이 복잡한 조율 과정은 사용자가 채팅을 주고받는 대화창 밖의 별도 공간에서 조용히 진행된다. 대화창 내부에서 모든 과정을 처리하면 작업 규모가 커질수록 이전 맥락을 잊거나 계획이 꼬이기 쉽지만, 외부에서 관제함으로써 대규모 작업에서도 일관성을 유지한다. 또한 작업 진행 상황을 실시간으로 저장해 시스템 오류나 네트워크 중단이 발생해도 처음부터 다시 시작할 필요가 없다. 멈춘 지점부터 바로 이어하기가 가능해 며칠씩 걸리는 장기 프로젝트도 안정적으로 수행한다. 다만 수백 명의 AI가 동시에 연산을 수행하므로 AI 처리 단위인 토큰 소비량은 일반 세션보다 훨씬 많다.
사용자는 설정 메뉴에서 ultracode 옵션을 활성화하거나 AI에게 직접 워크플로우 생성을 요청해 이 구조를 가동할 수 있다. 워크플로우가 시작되기 전 클로드는 어떤 단계로 작업을 수행할지 구체적인 계획서를 먼저 제시한다. 사용자가 이 계획을 확인하고 승인 버튼을 눌러야만 실제 보조 AI들이 투입되어 작업을 시작한다. 무분별한 토큰 낭비를 막고 사용자가 전체 공정을 제어할 수 있도록 안전장치를 둔 셈이다.
거대한 작업 하나를 AI 한 대가 끙끙대며 처리하던 방식에서 벗어나, 이제는 수백 명의 전문 비서가 동시에 움직이는 체제로 바뀐다. 클로드의 다이내믹 워크플로우는 상황에 맞춰 최적의 인력을 배치하고 업무 경로를 실시간으로 짜는 지휘자 역할을 수행한다. 개별 모델의 성능 경쟁을 넘어, AI들을 어떻게 엮어 효율적인 시스템을 만드느냐의 싸움이 시작된 셈이다. 이제 AI는 단순한 대화 상대를 넘어 스스로 조직을 구성해 문제를 해결하는 실행 엔진으로 진화한다.




