6월 5일 업데이트, 모든 코딩 에이전트를 위한 전용 런타임 등장

코딩 에이전트가 작업을 수행하는 동안 노트북 덮개를 닫지 못해 회의실을 이동하며 노트북을 반쯤 열어둔 채 걷는 풍경이 낯설지 않다. 아마존 베드락 에이전트코어 런타임(Amazon Bedrock AgentCore Runtime)은 노트북 전원 상태와 상관없이 실행 환경을 유지하며 모든 코딩 에이전트를 위한 표준 호스팅 환경을 제공한다. 이 런타임은 특정 모델에 종속되지 않으며 Claude Code, Codex, Kiro, OpenCode, Cursor CLI, Gemini CLI는 물론 개발자가 직접 구축한 사용자 정의 하네스까지 모두 수용한다. 배포 방식은 간단하다. 아마존 ECR(Elastic Container Registry)에 컨테이너를 푸시하거나 Python 또는 Node.js 프로젝트를 zip 파일로 배포하면 즉시 실행 가능한 환경이 구성된다.

6월 5일 업데이트를 통해 도입된 `agentcore exec --it` 명령어는 원격 환경에서도 로컬 터미널과 동일한 조작 환경을 제공한다. 이 명령어를 통해 PTY(Pseudo-Terminal) 기반의 인터랙티브 쉘에 직접 접속하면 터미널 내 색상 지원과 탭 완성, Ctrl+C를 통한 프로세스 중단, 터미널 리사이징, 네트워크 단절 시 자동 재연결 기능을 사용할 수 있다. 개발자는 이제 노트북을 닫아도 서버에서 돌아가는 에이전트의 세션에 언제든 다시 접속해 작업 상태를 확인할 수 있다.

Firecracker microVM과 MCP 기반의 워크스테이션 구조

아마존 베드락 에이전트코어는 각 세션마다 독립적인 Firecracker microVM(경량 가상 머신)을 할당해 세션 단절 시 환경을 다시 구축해야 하는 문제를 해결했다. 커널 수준의 물리적 격리를 통해 에이전트가 사용하는 파일시스템과 실행 환경을 완전히 분리하며, 각 microVM이 독립적인 리소스를 점유하므로 여러 에이전트를 동시에 실행해도 서로 간섭하지 않는다. 여기에 퍼블릭 프리뷰 단계인 Managed session storage를 결합해 설정 과정이 필요 없는 영구 디렉토리를 제공한다. 에이전트가 작성한 파일은 비활성 상태 기준 최대 14일간 보존되므로, 작업 중단 후 며칠 뒤에 다시 접속해도 이전 작업 맥락을 즉시 이어갈 수 있다.

에이전트는 Model Context Protocol(MCP: LLM과 외부 도구를 연결하는 표준 프로토콜) 엔드포인트를 통해 GitHub, Jira, Slack 같은 외부 협업 도구와 연결된다. MCP 게이트웨이가 통합 인터페이스를 제공해 도구 접근 권한을 중앙에서 제어하며, 실제 토큰은 에이전트 외부에서 관리되어 LLM이 제어하는 환경 내에 민감한 자격 증명이 노출되지 않는다. 운영 단계의 투명성을 위해 에이전트가 수행하는 모든 단계와 명령 실행 결과는 Amazon CloudWatch와 통합되어 실시간으로 기록된다. 관리자는 로그를 통해 에이전트의 코드 수정 경로와 오류 발생 지점을 정확히 추적한다.

기존 방식과 달라진 지점

여러 코딩 에이전트를 동시에 운용할 때 발생하는 환경 오염과 자원 충돌은 기존의 git worktree 방식으로는 해결하기 어려웠다. git worktree는 작업 디렉토리를 논리적으로 분리할 뿐 커널이나 네트워크 포트 같은 시스템 자원은 공유하기 때문이다. 아마존 베드락 에이전트코어는 Firecracker microVM 기반의 물리적 격리를 도입해 각 세션이 독립된 커널과 파일시스템을 갖게 함으로써 localhost:5432 같은 포트 충돌을 방지하고 시스템 설정 오류로 인해 전체 환경을 재구축하는 상황을 막는다.

상태 유지 방식에서도 개발자의 수동 개입이 줄어든다. 기존에는 에이전트의 작업 상태를 보존하기 위해 파일 변경 사항을 S3로 동기화하거나 프로세스 종료 전 데이터를 플러시(flush)하는 로직을 직접 구현해야 했다. 에이전트코어는 `/mnt/workspace`라는 영구 저장소를 제공해 node_modules, .git 폴더, 빌드 캐시를 그대로 유지한다. microVM이 유휴 상태로 전환되어 종료되더라도 파일시스템 상태가 보존되며, 사용자가 동일한 세션 ID로 다시 접속하면 밀리초 단위로 기존 파일시스템이 마운트되어 작업을 즉시 재개한다.

병렬 실행과 결정론적 명령어로 토큰 비용 및 시간 최적화

아마존 베드락 에이전트코어는 동일한 티켓에 대해 서로 다른 모델을 탑재한 에이전트 N개를 동시에 실행하는 병렬 처리 환경을 제공한다. 예를 들어 Opus 모델을 사용하는 Claude Code와 GPT-class 모델을 사용하는 Codex를 같은 코드베이스에 투입해 성능을 즉각 비교할 수 있다. 개발자는 어떤 모델이 더 적은 시도 끝에 테스트를 통과시키는지, 지연 시간과 비용이 얼마나 차이 나는지 정량적으로 확인하여 모델 선택의 기준을 실제 데이터로 전환한다.

또한 `InvokeAgentRuntimeCommand`를 통해 LLM을 배제하고 쉘 명령어를 microVM에 직접 전송하는 경로를 구축했다. `npm test`나 `git push`, 의존성 설치처럼 결과가 결정론적인 작업은 모델의 판단 없이 즉시 실행하며, 결과값인 stdout과 stderr는 HTTP/2 프로토콜을 통해 실시간으로 스트리밍된다. 모델이 명령어를 생성하고 전달하는 추론 루프를 제거함으로써 응답 속도를 높이고 토큰 비용을 줄인다. 특히 대규모 테스트 스위트를 실행할 때 불필요한 토큰 소비 없이 결과값만 빠르게 수집할 수 있다.

실무적으로는 하네스가 고도의 추론이 필요한 설계 단계에서만 LLM을 호출하고, 단순 실행 단계에서는 결정론적 명령어로 제어권을 가져오는 구조를 취한다. 이는 에이전트를 단순한 챗봇 형태의 자동화 도구가 아니라 정교하게 설계된 파이프라인의 일부로 통합하는 방식이다. 개발자는 조건이 충족되면 즉시 명령어를 실행하게 함으로써 모델의 성능 실험과 운영 비용 절감이라는 두 가지 목표를 동시에 달성한다.

한국 기업의 AI 에이전트 도입을 위한 보안 및 거버넌스 기준

기업용 ID 공급자(IdP, Identity Provider)와 연동된 Identity 레이어는 개인 노트북의 .env 파일에 API 키를 저장하던 수동적 관리 방식을 대체한다. 모든 네트워크 트래픽은 퍼블릭 인터넷을 거치지 않고 가상 프라이빗 클라우드(VPC, Virtual Private Cloud) 내부에서만 처리되어 보안 사고 가능성을 차단한다.

보안 팀은 모든 에이전트 호출과 실행 기록이 실시간으로 저장되는 AWS CloudTrail을 통해 감사 추적(Audit Trail)을 수행한다. 누가 어떤 시점에 명령을 내렸고 에이전트가 내부망의 어떤 자원에 접근했는지 전수 조사가 가능하다. 도구 접근 권한 역시 로컬 설정 파일이 아닌 중앙 집중식 정책 레이어(Policy layer)를 통해 제어하며, LLM 실행 환경 내부에 실제 자격 증명이 디스크 형태로 남지 않도록 설계해 인증 정보 유출 위험을 제거했다.

한국 기업의 IT 환경에서 보안 정책과 개발 생산성의 충돌은 큰 제약이었다. 로컬 환경에 코딩 에이전트를 구축하려면 VPC 설정부터 IdP 연동까지 막대한 인프라 구축 비용과 시간이 소모되었기 때문이다. 하지만 이 보안 체계를 도입하면 기업 보안 정책이 이미 적용된 상태에서 멀티 에이전트 병렬 실행 환경을 즉시 사용할 수 있다. 개발자는 보안 승인을 기다리거나 개인 장비의 취약점을 해결하는 대신, 인프라 팀이 정의한 정책 레이어 안에서 안전하게 사내 도구에 접근하고 코드 결과물을 내놓는 워크플로우를 실무에 적용한다.

노트북을 반쯤 열어둔 채 회의실을 이동하며 코딩 에이전트의 세션 중단을 걱정하던 풍경은 이제 과거가 된다. 아마존 베드락 에이전트코어는 Firecracker microVM 기반의 격리된 환경과 영구 저장소를 통해 세션을 유지하며, 개발자는 agentcore exec --it로 인터랙티브 쉘에 접속하거나 InvokeAgentRuntimeCommand로 LLM을 배제한 결정론적 명령을 실행한다.

기업은 로컬 환경 구축 비용 없이 VPC와 IdP 등 보안 정책이 적용된 멀티 에이전트 병렬 실행 환경을 즉시 도입한다. 인프라의 제약이 사라진 자리에 에이전트의 정교한 오케스트레이션이라는 실무적 과제만 남는다.