코드 89%를 짠 AI 에이전트, '인간 개발자 대체'는 없다

89%.

Cognition 사내 엔지니어들이 커밋한 전체 코드 중 AI 에이전트 Devin이 직접 작성한 비율이다. 숙련된 개발자 10명 중 9명의 몫을 AI가 처리하고 있는 셈이다. 그런데 정작 이 도구를 만든 CEO 스콧 우는 AI가 인간 개발자를 대체하는 미래를 부정한다.

최근 테크 기업들이 AI 도입을 명분으로 대규모 해고를 단행하는 흐름과 정반대되는 행보다. 스콧 우는 스스로를 9살 때부터 코딩을 시작한 프로그래머로 정의하며, 개발자가 느끼는 '무에서 유를 창조하는 즐거움'을 AI가 뺏어서는 안 된다고 강조한다. 그는 Devin을 단순한 도구가 아니라 더 많은 것을 만들게 돕는 '버디(Buddy)'로 규정한다. 260억 달러라는 천문학적인 기업 가치 뒤에 숨은 Cognition의 실제 활용 방식과 AI 에이전트가 지향하는 '자율 주행 소프트웨어 개발'의 실체가 무엇인지 분석한다.

260억 달러 가치의 Devin과 '자율 주행 소프트웨어'

오래된 라이브러리를 최신 버전으로 업데이트하거나 애플리케이션을 다른 플랫폼으로 이전하는 작업은 개발자가 가장 기피하는 반복 업무다. 코그니션(Cognition, AI 코딩 에이전트 개발사)은 최근 10억 달러의 투자를 유치하며 기업 가치 260억 달러를 기록했다. 10억 달러라는 막대한 투자금은 단순한 자금 확보를 넘어 고성능 컴퓨팅 자원과 인재를 확보해 에이전트 생태계를 빠르게 확장하려는 기반이 된다. 이들이 개발한 데빈(Devin)은 작업을 처음부터 끝까지 스스로 수행하는 엔드투엔드(End-to-End) 소유권을 핵심 특징으로 한다. 기존의 AI 코딩 도구가 개발자의 입력에 따라 코드 조각을 추천하는 보조적 수단이었다면, 데빈은 목표 설정부터 실행, 테스트, 오류 수정까지 전 과정을 자율적으로 처리한다. 코그니션은 이를 통해 소프트웨어 개발의 전 과정을 자동화하는 자율 주행 소프트웨어 개발 시대로의 전환을 꾀하고 있다.

코그니션 내부의 실제 코드 커밋 수치는 에이전트의 실질적인 활용도를 수치로 증명한다. 사내 엔지니어들이 제출한 전체 코드 커밋의 89%를 데빈이 직접 수행했다. 나머지 코드 분량은 지난해 인수한 윈드서프(Windsurf, AI 코딩 경쟁사)의 로컬 에이전트가 처리했다. 로컬 에이전트는 개발자의 편집기 내에서 즉각적인 도움을 주고, 데빈은 독립적인 환경에서 전체 프로젝트를 완수하는 식으로 역할이 분리되어 있다. 이는 개발자가 코드를 직접 작성하는 시간보다 에이전트가 생성한 결과물을 검토하고 승인하는 시간이 더 많아졌음을 보여준다. 메인 에이전트인 데빈이 전체적인 작업 흐름을 주도하고 로컬 에이전트가 세부 구현을 보조하며 개발 프로세스의 주도권을 AI가 가져가는 구조다.

데빈의 현재 성능 수준은 수행하는 작업의 난이도에 따라 주니어 엔지니어에서 미드 레벨인 L4 엔지니어 사이의 역량을 보유하고 있다. 특히 많은 프로그래머가 지루하게 느끼는 롱테일(Long-tail) 유지보수 작업에서 높은 효율을 보인다. 구형 소프트웨어를 최신 환경에 맞게 갱신하거나 복잡한 플랫폼 이전 작업을 수행하는 것이 대표적인 사례다. 이러한 역할 분담은 개발자를 단순 노동의 고통에서 해방시켜 제품의 핵심 가치를 만드는 창의적인 설계에 더 많은 시간을 할애하게 만든다. 코그니션이 지향하는 자율 주행 소프트웨어는 에이전트가 스스로 학습하고 성능을 개선하며 더 높은 수준의 엔지니어링 단계로 진입하는 재귀적 발전을 전제로 한다.

'대체'가 아닌 '추상화' — 유지보수 자동화와 도메인 확장

구형 라이브러리를 최신 버전으로 올리거나 기존 애플리케이션을 다른 플랫폼으로 옮기는 작업은 개발자가 가장 기피하는 업무다. 단순 반복적이지만 실수하면 시스템 전체가 마비되는 고위험 저효율 작업이기 때문이다. 코그니션(Cognition, AI 코딩 에이전트 개발사)의 데빈(Devin)은 이러한 롱테일 유지보수 작업을 전담하도록 설계되었다. 롱테일 유지보수란 버전 업데이트나 플랫폼 이전처럼 빈도는 낮지만 반드시 처리해야 하는 파편화된 작업들을 의미한다. 실제 코그니션 내부 엔지니어들이 커밋한 코드의 89%는 데빈이 작성했다. 나머지 물량은 지난해 인수한 윈드서프(Windsurf)의 로컬 에이전트들이 처리했다. 개발자가 직접 코드를 치는 시간보다 에이전트가 생성한 결과물을 검토하고 승인하는 시간이 더 길어졌다. 이는 단순 반복적인 노동에서 개발자를 분리해 창의적인 설계 영역으로 이동시키는 실질적인 변화다.

과거 시각적 개발 환경이 복잡한 기계어 명령을 추상화해 개발 진입장벽을 낮췄던 사례와 유사하다. 어셈블리 언어에서 고수준 언어로의 전환이 생산성을 높였듯, 에이전트는 자연어 구상을 즉시 실행 가능한 코드로 변환하는 가교 역할을 수행한다. 아이디어를 실제 제품으로 구현하는 과정에서 발생하는 물리적인 타이핑, 문법 오류 수정, 환경 설정 등의 디버깅 과정을 에이전트가 중간에서 처리하는 방식이다. 스콧 우(Scott Wu) 코그니션 CEO는 이를 개발자를 대체하는 도구가 아니라 더 많은 것을 만들게 돕는 동료로 정의한다. 개발자는 이제 세부적인 함수 구현 방법보다 어떤 기능을 통해 사용자 경험을 개선할 것인가라는 본질적인 기획에 집중한다. 생산 도구의 진화가 개발자의 역할을 단순 작성자에서 전체 시스템의 설계 및 감독자로 전환시켰다.

소프트웨어 개발 영역에서 검증된 에이전트 모델은 고객 서비스와 의료 등 타 산업군으로 확장될 가능성이 크다. 의료 분야에서는 환자 데이터 분석과 진단 보조를, 고객 서비스에서는 복잡한 클레임 처리 프로세스의 자동화를 담당하며 인간 전문가의 업무 부하를 줄이는 식이다. 에이전트가 스스로 수행 결과를 분석하고 학습하여 성능을 개선하는 재귀적(Recursive) 학습을 통해 자율 주행 소프트웨어 단계로 진입하는 것이 지향점이다. 특정 도메인의 전문 데이터를 학습한 에이전트가 복잡한 업무 프로세스를 스스로 최적화하며 운영 효율을 극대화하는 구조다. 다만 기술적 자율성이 높아지더라도 무엇을 할지 결정하는 최종 권한은 항상 인간이 보유해야 한다는 운영 원칙을 전제로 한다. 에이전트의 역할은 인간의 판단을 보조하고 실행 속도를 높이는 증강에 머물며, 최종 승인 단계에서 인간의 개입은 필수적이다. 이는 전문직의 업무 방식이 도구의 자동화와 인간의 의사결정으로 명확히 이분화되는 과정이다.

코드 생성률 89%는 단순 구현 단계의 자동화가 사실상 완성 단계에 진입했음을 증명한다. 다만 복잡한 시스템 설계와 최종 검증이라는 핵심 권한은 여전히 인간 개발자의 몫으로 남는다. 도구의 성능 향상이 인력의 대체로 직결되지 않는 이유는 기술적 구현보다 논리적 완결성이 더 높은 가치를 갖기 때문이다. 개발자의 역할은 이제 작성자에서 검토자로 바뀐다.

코드 89%를 짠 AI 에이전트, '인간 개발자 대체'는 없다

260억 달러 가치의 Devin과 '자율 주행 소프트웨어'

'대체'가 아닌 '추상화' — 유지보수 자동화와 도메인 확장

관련 기사