"Trouw told in an email." XYO의 설립자이자 CEO인 아리 트라우(Arie Trouw)는 벤처비트와의 이메일 인터뷰에서 개발자들이 기존의 결정론적인 서비스를 확률적인 서비스로 대체할 때 발생할 수 있는 위험성을 강력하게 경고했다. 그는 이러한 전환이 최악의 경우 데이터 오염이나 예측 불가능한 결과를 초래할 수 있으며, 이는 마치 성능 좋은 망치를 갖게 된 사람이 모든 문제를 못으로 보려는 전형적인 오류와 같다고 꼬집었다.

이 날선 비판은 지금 개발자 커뮤니티에서 가장 뜨거운 감자인 '에이전트 실행 계층의 통제권' 문제를 정면으로 겨냥한다. 구글이 최근 제미나이 API에 공개한 'Managed Agents'는 그동안 개발자들이 며칠, 때로는 몇 주씩 매달려야 했던 실행 환경 구축과 샌드박스 관리, 도구 호출 인프라 연결 작업을 단 한 번의 API 호출로 끝내겠다고 선언했기 때문이다. 인프라의 복잡성을 구글이 통째로 삼키겠다는 이 공격적인 행보가 개발자들에게는 '해방'일까, 아니면 '위험한 의존'일까를 두고 논쟁이 격화되고 있다.

Gemini API 'Managed Agents'와 Antigravity CLI의 등장

개발자가 에이전트를 하나 만들 때 가장 먼저 마주하는 건 모델의 성능이 아니라 지루한 인프라 설정 작업이다. 실행 환경을 구축하고 샌드박스를 설정하며 도구 호출 인프라를 하나하나 연결하는 데만 며칠을 허비하는 게 그동안의 상식이었다. 구글은 이번에 Gemini API 내에 Managed Agents(매니지드 에이전트, 인프라 관리형 에이전트 서비스)를 공개하며 이 과정을 API 호출 한 번으로 압축하겠다고 선언했다. 개발자 커뮤니티에서는 단순한 기능 추가가 아니라 배포의 복잡성을 완전히 제거하려는 시도로 읽히며 지금 매우 뜨거운 반응이 오고 있다.

함께 공개된 Antigravity CLI(안티그래비티 CLI, 에이전트 구축 및 관리를 위한 명령줄 인터페이스)는 개발자가 터미널에서 직접 에이전트를 제어하고 배포할 수 있게 돕는다. 현재 Google AI Studio 내의 새로운 커스텀 템플릿을 통해 프리뷰 형태로 제공되고 있어 실제 적용 가능성을 타진하는 이들이 늘고 있다. 단순히 모델을 튜닝하는 단계를 넘어 에이전트가 실제로 구동될 환경 전체를 구글이 직접 관리하는 수직 통합 구조를 지향한다. 이는 개발자가 인프라 고민 없이 에이전트의 행동 양식과 제품 경험에만 집중할 수 있는 환경을 만들겠다는 전략이다.

지금까지의 에이전트 오케스트레이션(Orchestration, 여러 모델과 도구를 조율하는 과정)은 모델 상단에 별도의 프레임워크를 얹어 라우팅과 실행을 따로 제어하는 방식이 주류였다. 하지만 최근의 흐름은 이 오케스트레이션 계층을 플랫폼 내부로 흡수하는 방향으로 급격히 기울고 있다. 구글의 Managed Agents는 실행 환경과 샌드박스, 그리고 도구 호출 인프라 구축을 완전히 자동화함으로써 이 흐름에 정면으로 올라탔다. 개발자들 사이에서는 런타임이 플랫폼 내부로 들어오면서 반복 주기(Iteration pace)가 완전히 달라졌다는 평가가 나온다.

특히 구글의 접근 방식은 모델과 하네스(Harness, 모델 실행을 돕는 보조 장치), 그리고 샌드박스를 하나로 최적화해 구글이 관리하는 보안 환경에서 실행한다는 점이 핵심이다. 이는 단순한 편의 제공을 넘어 인프라 전체를 소유하려는 전략적 움직임으로 해석된다. 기존에 개발자가 직접 구축해야 했던 복잡한 실행 루프를 플랫폼이 대신 처리해주면서 에이전트의 도메인 특화 동작을 구현하는 속도가 비약적으로 빨라졌다. 인프라 계층의 복잡성을 추상화하여 개발자가 느끼는 진입 장벽을 낮추는 동시에 플랫폼 종속성을 강화하는 구글 특유의 수직 통합 방식이 이번 업데이트의 본질이다.

모델 계층 vs 인프라 계층: 구글·앤스로픽·AWS의 3색 전략

개발자가 에이전트를 하나 구축할 때 가장 먼저 마주하는 건 모델의 지능이 아니라 샌드박스(격리된 실행 환경)를 세우고 툴 호출 인프라를 연결하는 지루한 밑작업이다. 예전에는 이 과정을 사람이 일일이 붙잡고 설정했으나 지금은 이 오케스트레이션(작업 조율) 주도권을 누가 가져가느냐를 두고 빅테크들의 전략이 극명하게 갈리고 있다. 커뮤니티에서는 이제 별도의 프레임워크를 써서 제어권을 쥘 것인지 아니면 플랫폼 내장 기능을 믿고 속도를 낼 것인지에 대한 논쟁이 뜨겁다. 특히 수주가 걸리던 배포 작업이 API 호출 한 번으로 줄어드는 경험을 한 개발자들 사이에서 실행 계층의 변화에 대한 체감이 빠르게 확산하고 있다.

앤스로픽(Anthropic)은 오케스트레이션을 모델 계층에 직접 내장하는 승부수를 던졌다. Claude Managed Agents(클로드 관리형 에이전트)를 통해 모델이 추론과 조율을 직접 담당하게 하고 실행 제어권만 기업에 부여하는 구조다. 개발자들 사이에서는 모델이 충분히 똑똑해진다면 굳이 외부에서 복잡하게 경로를 지정할 필요가 없다는 시각이 힘을 얻고 있다. 모델 자체가 뇌이자 지휘자가 되어 작업을 배분하는 방식이라 설정 단계가 획기적으로 줄어든다는 반응이다. 이는 모델의 추론 능력을 극대화해 오케스트레이션 평면으로 활용하려는 전략으로 풀이된다.

AWS는 인프라 계층의 강점을 살려 배포 전 단계의 관리형 하네스(Harness, 소프트웨어 실행 및 테스트를 위한 보조 도구)를 제공하는 데 집중한다. Bedrock AgentCore(베드록 에이전트코어, 에이전트 구축 및 배포를 돕는 AWS의 관리형 프레임워크)를 통해 복잡한 배포 준비 과정을 표준화된 틀로 묶어 제공하는 방식이다. 권한 부여와 인프라 관리 효율성에 무게를 둔 이 접근법은 기존 AWS 환경을 깊게 사용하는 기업들에게 익숙한 경로를 제공한다. 모델 자체보다는 모델을 둘러싼 실행 환경의 안정성과 보안을 중시하는 보수적인 엔터프라이즈 개발 환경에서 선호도가 높다.

구글(Google)은 모델과 하네스 그리고 샌드박스를 함께 최적화하여 구글이 관리하는 보안 환경에서 전체를 실행하는 수직 통합 방식을 밀어붙이고 있다. Gemini API(제미나이 API)의 Managed Agents(관리형 에이전트)는 런타임(프로그램 실행 환경) 자체를 플랫폼 내부로 끌어들여 개발자가 인프라 고민 없이 도메인 특화 동작에만 집중하게 만든다. 커뮤니티에서는 구글 생태계에 완전히 종속될 수 있다는 락인(Lock-in) 우려와 함께 개발 속도가 압도적으로 빨라진다는 실용적 찬사가 충돌하고 있다. 특히 결정론적인 서비스가 확률적인 서비스로 대체되면서 발생할 수 있는 예측 불가능한 결과나 데이터 오염 가능성에 대해 경계하는 목소리도 높다.

'확률적 서비스'의 함정과 개발자 경험의 가속화

개발자가 에이전트를 하나 배포하기 위해 며칠 동안 샌드박스를 설정하고 툴 호출 인프라를 엮던 작업이 이제 API 호출 한 번으로 끝난다. 런타임(Runtime, 프로그램 실행 환경)이 플랫폼 내부로 흡수되면서 개발자는 더 이상 인프라의 하부 구조를 붙잡고 씨름할 필요가 없게 됐다. 램프(Ramp)의 르네 술탄(René Sultan)은 이러한 변화를 통해 개발자가 도메인 특화 행동 설계와 반복적인 개선에만 온전히 집중할 수 있는 환경이 조성됐다고 분석한다. 인프라 계층에서 별도로 관리하던 에이전트 런타임이 실행 계층인 플랫폼 자체로 통합되면서 배포 속도는 비약적으로 빨라졌고, 이는 개발자 경험의 패러다임을 완전히 바꾼다.

지금 커뮤니티에서 뜨거운 논쟁이 벌어지는 지점은 바로 이 제어권의 이동이다. 과거에는 모델 위에 오케스트레이션 프레임워크를 얹어 라우팅과 실행 과정을 세밀하게 조정했지만, 이제는 모델과 하네스(Harness, 테스트 및 실행 도구) 그리고 샌드박스가 하나로 최적화되어 플랫폼이 이를 통제한다. 개발자들은 이제 인프라 설정 지옥에서 벗어났다며 환호하면서도, 한편으로는 내부 동작 과정을 알 수 없는 블랙박스 형태의 실행 구조에 대해 불안감을 드러낸다. 플랫폼이 실행 계층을 완전히 소유하게 되면서 개발자의 역할은 시스템 설계자에서 행동 최적화자로 빠르게 전환되고 있다.

하지만 이런 가속도 뒤에는 확률적 서비스라는 위험한 함정이 숨어 있다. XYO의 설립자이자 CEO인 아리 트라우(Arie Trouw)는 기존의 결정론적(Deterministic) 서비스가 확률적(Probabilistic) 서비스로 대체되는 현상을 경고한다. 결정론적 서비스는 동일한 입력에 항상 동일한 출력을 내놓지만, LLM 기반의 확률적 서비스는 매번 결과가 달라질 수 있다. 이는 최악의 경우 예측 불가능한 결과물을 사용자에게 전달하거나 심지어 데이터 오염으로 이어질 위험을 내포한다. 트라우는 이를 두고 멋진 망치를 갖게 된 후 모든 것이 못으로 보이기 시작하는 전형적인 패턴이라고 꼬집는다.

현장의 개발자들은 이 지점에서 심각한 딜레마에 빠진다. 배포 속도를 위해 제어권을 포기하고 확률적 결과에 베팅할 것인지, 아니면 느리더라도 예측 가능한 시스템을 고수할 것인지에 대한 갈등이다. 특히 금융이나 의료처럼 단 한 번의 오작동이 치명적인 도메인에서는 플랫폼의 편리함보다 데이터 무결성이 우선시된다. 그럼에도 불구하고 플랫폼이 제공하는 압도적인 개발 속도는 거부하기 힘든 유혹이며, 많은 팀이 리스크를 감수하고 확률적 서비스로의 전환을 서두르고 있다. 제어권 상실이라는 비용을 지불하고 얻은 속도가 과연 지속 가능한 경쟁력이 될 것인지에 대한 의구심이 커지고 있다.