안드레이 카파시(Andrej Karpathy)가 5월 19일 경쟁 AI 연구소인 앤스로픽(Anthropic)에 합류한다고 발표했다. 슬로바키아-캐나다 출신의 AI 연구자인 그는 OpenAI의 초기 공동 창립자 11인 중 한 명이며 테슬라(Tesla)의 AI 부문 책임자를 역임한 인물이다. 이번 합류는 단순한 인력 이동을 넘어 앤스로픽의 핵심 기술 스택인 사전학습(Pretraining) 단계에 직접적인 변화를 예고한다.

특히 카파시는 앤스로픽의 AI 모델인 클로드(Claude)를 활용해 사전학습 연구 자체를 가속화하는 전담 팀을 구축할 계획이다. 이는 인간의 개입을 최소화하거나 완전히 배제한 채 AI가 스스로 다음 세대 모델을 훈련시키는 '재귀적 자기 개선(Recursive Self-improvement)'이라는 궁극적인 연구 목표와 맞닿아 있다. 주목할 점은 이번 발표가 구글(Google)의 연례 개발자 컨퍼런스인 I/O가 시작된 날과 겹쳤다는 사실이다. 카파시는 그동안 학술 연구, 기업 내 대규모 배포, 그리고 온라인 교육이라는 세 가지 영역을 모두 섭렵하며 AI 생태계에서 독보적인 영향력을 유지해 왔다.

안드레이 카파시의 앤스로픽 합류와 사전학습 가속화 팀 신설

안드레이 카파시가 2026년 5월 19일 앤스로픽 합류를 공식 발표했다. 주목할 점은 발표 시점이다. 구글의 연례 개발자 컨퍼런스인 I/O가 캘리포니아 마운틴뷰 본사에서 개최된 날과 정확히 일치한다. 경쟁사의 대규모 업데이트 발표가 예상되는 시점에 맞춰 핵심 인재 영입 사실을 공개함으로써 시장의 관심을 분산시키거나 대조적인 기술 방향성을 제시하려는 의도로 풀이된다.

카파시의 구체적인 임무는 앤스로픽의 자체 모델인 클로드(Claude)를 활용해 사전학습 연구 자체를 가속화하는 전담 팀을 구축하는 것이다. 앤스로픽의 사전학습 책임자인 니콜라스 조셉(Nicholas Joseph)은 카파시가 이 팀의 설계와 운영을 맡게 될 것임을 확인했다. 이 팀의 최종 지향점은 재귀적 자기 개선(Recursive Self-improvement)의 구현이다. 이는 AI가 인간의 개입을 점진적으로 줄이거나 완전히 배제한 상태에서 스스로 다음 세대 모델을 학습시키고 성능을 업그레이드하는 체계를 구축하는 것을 의미한다.

이러한 역할 부여는 카파시가 보유한 다각도의 실무 경험에 근거한다. 그는 OpenAI의 창립 멤버였을 뿐만 아니라 2017년부터 2022년까지 테슬라의 AI 부문 책임자로서 오토파일럿을 위한 컴퓨터 비전 팀을 이끌었다. 당시 그는 사내 데이터 라벨링부터 신경망 학습, 테슬라 전용 추론 칩으로의 배포까지 전체 파이프라인을 관리했다. 반면 최근 2023년부터 2024년까지 OpenAI에서 수행한 미드트레이닝(Midtraining) 및 합성 데이터 생성 팀 구축 경험은 이번 앤스로픽의 사전학습 가속화 전략과 직접적인 기술적 접점을 가진다.

학술적 배경 또한 이번 팀 신설의 핵심 동력이다. 카파시는 스탠퍼드 대학교에서 페이페이 리(Fei-Fei Li) 교수 지도하에 컴퓨터 비전과 자연어 처리의 교차 영역을 연구하며 박사 학위를 취득했다. 그러나 최근 2년간 그는 유레카 랩스(Eureka Labs)를 설립하고 LLM101n과 같은 교육 과정을 통해 AI 대중화에 집중해 왔다. 이번 합류로 인해 이러한 교육 활동은 일시적으로 중단될 예정이다. 카파시는 교육에 대한 열정은 유지하되 적절한 시점에 작업을 재개하겠다고 밝혔으나, 당분간은 앤스로픽의 R&D 현장에서 모델의 자기 진화 구조를 설계하는 데 전념할 것으로 분석된다.

테슬라와 OpenAI를 거친 데이터 엔지니어링 경험의 전이

스탠퍼드대에서 페이페이 리(Fei-Fei Li) 교수의 지도 아래 박사 학위를 취득하며 신경망 기반의 컴퓨터 비전과 자연어 처리, 그리고 두 분야의 교차점을 연구했다. 특히 딥러닝 입문 과정인 CS231n 코스를 직접 제작하며 복잡한 신경망 구조를 체계화하는 능력을 증명했다. 반면 실무적 감각은 구글 브레인(Google Brain)과 구글 리서치, 딥마인드(DeepMind)에서의 인턴십을 통해 보완했다. 학술적 이론과 빅테크의 대규모 연구 환경을 모두 경험한 이력은 그가 단순한 연구자를 넘어 시스템 설계자로 성장하는 기반이 되었다.

2017년부터 2022년까지 테슬라의 오토파일럿 컴퓨터 비전 팀 리드로 재직하며 데이터 파이프라인의 수직 계열화를 직접 구현했다. 당시 그는 외부 업체에 의존하는 일반적인 방식과 달리 자체 데이터 레이블링 시스템을 구축하고, 이를 최적화된 커스텀 추론 칩에 배포하는 전 과정을 총괄했다. 주목할 점은 모델의 알고리즘 개선보다 데이터를 수집하고 정제하여 칩에 올리는 엔지니어링 효율성에 집중했다는 사실이다. 이는 대규모 데이터를 실시간으로 처리해야 하는 자율주행 환경의 특성이 반영된 결과이며, 하드웨어와 소프트웨어의 밀결합을 통해 성능을 끌어올리는 전략적 접근이었다.

이후 2023년부터 2024년까지 OpenAI에서 미드트레이닝(Midtraining)과 합성 데이터 생성(Synthetic Data Generation) 팀을 구축하며 전략의 중심을 데이터의 질적 전환으로 옮겼다. 미드트레이닝은 초기 사전학습과 최종 미세조정 사이의 간극을 메우는 과정으로, 모델의 추론 능력을 정교하게 다듬는 핵심 단계다. 그러나 사람이 직접 작성한 고품질 데이터의 공급이 한계에 다다르자, AI가 생성한 데이터를 다시 학습에 활용하는 합성 데이터 전략을 통해 데이터 부족 문제를 해결하려 했다. 테슬라에서 익힌 대규모 데이터 핸들링 능력이 LLM의 데이터 효율성 극대화라는 과제와 결합된 시점이다.

앤스로픽에서의 역할은 이러한 인프라 구축 경험과 합성 데이터 전략의 완전한 이식을 의미한다. 클로드(Claude)를 활용해 사전학습 연구 자체를 가속화하는 팀을 만든다는 것은 AI 모델이 스스로의 학습 데이터를 생성하고 연구 경로를 최적화하는 시스템을 구축하는 작업이다. 반면 이는 단순한 모델 업데이트를 넘어 AI가 스스로 다음 세대의 모델을 학습시키거나 기능을 업그레이드하는 재귀적 자기 개선(Recursive Self-improvement)의 실현으로 이어진다. 테슬라의 하드웨어 최적화 관점과 OpenAI의 합성 데이터 방법론이 앤스로픽의 사전학습 전략과 결합하며 연구 주기를 단축시키는 구조다.

오픈소스 기여 활동의 중단 가능성과 폐쇄적 모델 생태계의 충돌

카파시는 2024년 7월 AI 네이티브 학교인 유레카 랩스(Eureka Labs, AI 기반 교육 기관)를 설립하고 학부 수준의 LLM 학습 코스인 LLM101n을 런칭했다. 그는 단순히 강의를 제공하는 수준을 넘어 LLM 기반의 자동 연구원인 autoresearch와 자율 메모리 저장 시스템인 LLM Knowledge Base 같은 오픈소스 프로젝트를 통해 AI 연구의 방법론을 대중에게 공개해 왔다. 특히 autoresearch는 여러 가설과 실험을 동시에 수행하는 자동화된 연구 프로세스를 지향하며 오픈소스 AI 연구의 지평을 넓혔다는 평가를 받는다. 그러나 앤스로픽 합류와 동시에 교육 관련 작업은 추후 재개하겠다는 입장을 밝히며 사실상 활동의 일시 중단을 시사했다. 이는 그가 지향해온 지식의 민주화 행보가 기업의 폐쇄적 연구 환경과 물리적으로 충돌할 수밖에 없음을 보여주는 대목이다.

앤스로픽의 생태계 운영 방식은 부분적 개방과 핵심 기술의 폐쇄라는 이중적 구조를 띠고 있다. 모델 컨텍스트 프로토콜(MCP, 모델과 외부 데이터 연결 표준)을 공개하며 외부 도구와의 연결성을 확장하려는 전략을 취하고 있다. 반면 주력 모델인 클로드(Claude)와 개발 도구인 클로드 코드(Claude Code)는 철저히 폐쇄적으로 운영하며 기술적 해자를 구축하는 데 집중한다. 주목할 점은 오픈소스 커뮤니티의 강력한 지지를 받는 카파시가 이러한 폐쇄적 모델 정책 하에서 기존의 오픈소스 기여 철학을 어떻게 조화시킬 것인가 하는 문제다. 만약 그가 추진하는 사전학습 가속화 도구들이 앤스로픽 내부의 최적화 도구로만 남게 된다면, 그동안 그가 구축해온 오픈소스 생태계의 영향력은 급격히 감소할 가능성이 크다.

한국의 AI 실무자 관점에서 이번 합류가 시사하는 핵심적인 변화는 사전학습 자동화 기술의 보편화에 따른 데이터 전략의 재편이다. 카파시가 구축할 사전학습 연구 가속화 팀이 클로드를 활용해 재귀적 자기 개선(Recursive Self-improvement, AI가 스스로 다음 세대 모델을 학습시키는 기술)을 현실화한다면, 기존의 데이터 확보 패러다임은 변화할 수밖에 없다. 지금까지의 경쟁이 양질의 원천 데이터를 누가 더 많이 확보하느냐는 물량전이었다면, 앞으로는 데이터를 어떻게 합성하고 정제하여 학습 루프에 효율적으로 태울 것인지에 대한 파이프라인 설계 능력이 핵심 경쟁력이 된다. 이는 데이터 수집에 막대한 자본을 투입하던 기존 전략에서 벗어나, 학습 자동화 아키텍처를 구축하는 기술적 전환이 강제되는 시점이 도래했음을 의미한다.