인프라 구축 없이 에이전트 양산으로, Bedrock AgentCore harness 정식 출시

단 두 번의 API 호출로 끝내는 에이전트 배포, AgentCore

개인 노트북에서 구현한 AI 에이전트 프로토타입을 실제 서비스 환경으로 옮길 때 개발자는 인프라 구축이라는 벽에 부딪힌다. 동시성 처리, 환경 격리, 신원 확인, 상태 유지 및 확장성을 위해 샌드박스 컴퓨팅 환경과 저장소, 네트워크, 보안 설정을 일일이 연결하는 작업이 필요하기 때문이다. Amazon Bedrock은 이러한 오케스트레이션과 인프라 부담을 제거한 AgentCore harness를 정식 출시했다. 이제 개발자는 복잡한 컨테이너 빌드 과정 없이 `CreateHarness`와 `InvokeHarness`라는 단 두 번의 API 호출만으로 프로덕션급 에이전트를 배포하고 실행할 수 있다.

AgentCore harness는 에이전트 작동에 필요한 핵심 요소들을 관리형 추상화 계층으로 묶어 제공한다. 구체적으로는 코드 실행 환경인 런타임(Runtime), 대화 맥락을 저장하는 메모리(Memory), 외부 서비스 연결을 위한 게이트웨이(Gateway), 웹 탐색을 위한 브라우저(Browser), 권한 및 인증을 관리하는 아이덴티티(Identity), 시스템 상태를 확인하는 관측성(Observability)이라는 6가지 기본 요소(Primitives)가 통합되어 있다. 기존에는 개발자가 각 요소를 개별적으로 생성하고 수동으로 연결해야 했으나, 하네스는 이를 설정 기반의 관리형 서비스로 전환했다. 이를 통해 개발자는 인프라 세부 설정보다 에이전트의 작업 정의와 모델 응답 품질을 높이는 핵심 로직에 집중할 수 있다.

에이전트의 실행과 모니터링 과정은 AWS의 기존 관리형 서비스와 통합되어 작동한다. 모든 작동 단계는 실시간으로 스트리밍되며, Amazon CloudWatch를 통해 자동으로 트레이싱(Tracing)되어 기록된다. 별도의 오케스트레이션 코드를 작성하거나 전용 컨테이너를 직접 빌드할 필요 없이, API 호출과 설정만으로 환경을 변경할 수 있어 프로토타입에서 실제 서비스 단계로 넘어가는 전환 시간을 단축했다.

격리된 환경과 선언적 도구 연결의 작동 방식

Amazon Bedrock AgentCore harness는 마이크로VM(작업을 완전히 분리해 실행하는 가벼운 가상 머신) 기반의 격리 환경을 구축해 보안과 안정성을 보장한다. 이 환경은 외부와 차단된 독립적인 파일 시스템과 쉘을 갖추고 있어 에이전트가 안전하게 파일을 읽고 쓰거나 코드를 실행할 수 있다. 특히 `shell`과 `file_operations` 기능이 기본 내장되어 있어, 모델이 마이크로VM 내부에서 명령어를 수행하고 파일 시스템을 조작하는 상태 유지형 작업이 즉시 작동한다. 이는 로컬 프로토타입 단계의 환경 설정 번거로움을 없애고 프로덕션 수준의 샌드박스를 즉각 제공한다.

도구 연결 과정에서는 어댑터 코드 작성과 인증 설정의 불편함을 제거했다. 개발자가 `CreateHarness` API를 통해 도구들을 리스트 형태로 선언하면, 하네스가 해당 도구의 연결과 인증, 실행 전 과정을 자동으로 처리한다. 각 도구 항목은 유형과 설정 블록으로 정의되며, 하네스는 이 선언적 정의를 바탕으로 런타임에 필요한 연결 고리를 생성한다. 외부 도구와의 통신에는 게이트웨이나 MCP(Model Context Protocol)를 활용해 데이터 흐름을 제어하므로, 개발자가 API마다 개별 어댑터 코드를 작성하거나 MCP 서버의 생명주기를 직접 관리하며 컨테이너를 빌드할 필요가 없다.

보안의 핵심인 API 키 관리 역시 에이전트의 접근 권한을 분리한 구조를 따른다. 모델 제공자 접근에 필요한 API 키는 AgentCore Identity의 토큰 볼트(자격 증명을 암호화해 저장하는 보안 저장소)에 보관된다. 에이전트는 실행 과정에서 원본 자격 증명(raw credentials)에 직접 접근하지 못하며, 모든 인증 요청은 하네스가 토큰 볼트를 통해 대리 수행한다. 이러한 은닉 구조는 자격 증명 유출 사고를 방지하고 보안 설정에 소요되는 시간을 줄여준다.

수동 구축에서 관리형 메모리로: 인프라 오버헤드 제거

프리뷰 단계의 Amazon Bedrock AgentCore에서는 사용자의 기억을 유지하기 위해 AgentCore Memory라는 별도의 리소스를 생성하고 ARN(Amazon Resource Name)을 직접 전달해야 했다. 에이전트를 배포할 때마다 메모리 저장소를 따로 만들고 API로 연결하는 수동 리소스 매핑 과정은 운영 공수를 높이는 원인이 되었다.

정식 출시 버전에서는 `CreateHarness` API 호출 시 메모리 설정을 생략하면 관리형 메모리가 자동으로 생성된다. 시스템이 알아서 메모리 자원을 할당하고 에이전트에 바인딩하므로, 리소스 프로비저닝에 소요되던 시간이 제거된다. 개발자는 인프라 연결 코드를 작성하는 대신 에이전트가 기억해야 할 정보의 성격과 스킬 최적화라는 핵심 로직에 집중할 수 있다.

자동 생성된 관리형 메모리는 SEMANTIC(의미 기반 검색)과 SUMMARIZATION(대화 요약) 전략을 동시에 적용한다. 과거 대화 내용 중 현재 질문과 의미적으로 유사한 정보를 찾아내고 전체 맥락을 요약하여 모델의 컨텍스트 창에 전달하는 구조다. 데이터 보존 기간은 30일이며, AWS 소유의 암호화 키로 보안을 유지한다. 또한 actorId(사용자 식별자) 기반의 네임스페이스 템플릿을 통해 멀티테넌트 격리를 수행함으로써, 다수 사용자가 접속해도 개별 사용자의 기억이 섞이지 않도록 분리한다.

상태 저장이 필요 없는 에이전트의 경우 `memory: { disabled: {} }` 설정을 통해 기능을 제외할 수 있다. 이미 보유한 특정 메모리 리소스를 연결해야 한다면 agentCoreMemoryConfiguration 필드에 해당 ARN을 전달하여 재사용한다. 관리형 메모리를 사용하다가 자체 리소스로 전환하려면 `UpdateHarness` API를 호출하여 ARN을 업데이트하면 되며, 이때 기존 관리형 메모리는 즉시 분리된다.

모델 종속성 탈피와 AWS 큐레이션 스킬셋의 확장성

Amazon Bedrock AgentCore harness는 세션 중간에 모델 제공자를 변경해도 기존 대화 맥락을 유지하는 구조를 갖췄다. 예를 들어 Claude Opus로 복잡한 논리 계획을 세운 뒤, GPT-5.5로 실제 구현 코드를 작성하고, 다시 Gemini로 최종 결과를 요약하는 흐름을 하나의 세션에서 구현할 수 있다. `CreateHarness` 단계에서 기본 모델을 지정하고, 개별 `InvokeHarness` 호출 시 해당 모델을 오버라이드하여 특정 호출에서만 다른 모델을 사용하도록 설정하는 방식이다. 이를 통해 모델별 가격 대비 성능을 비교하거나, 최신 모델 업데이트 이후의 회귀 테스트를 실제 서비스 환경과 동일한 조건에서 수행할 수 있다.

에이전트가 특정 도메인의 전문 지식을 갖추게 하려면 파일, 스크립트, 지침을 묶은 번들 형태의 HarnessSkill을 활용한다. 하네스는 실제 작업 수행 시점에만 해당 스킬의 메타데이터를 확인하고 내용을 컨텍스트에 포함시킨다. 스킬 소스는 S3, GitHub, Bedrock Knowledge Base, 내장 런타임 등 4가지 경로를 지원한다. 하네스는 세션 시작 시점이나 설정 변경 시 각 스킬을 세션 파일 시스템에 배치하므로, 개발자는 컨테이너를 새로 빌드하거나 쉘에 접속해 파일을 수정할 필요 없이 선언적 설정만으로 지식 셋을 업데이트할 수 있다.

AWS 환경 관리자는 `awsSkills` 토글 하나로 AWS 전 영역의 큐레이션 스킬셋을 즉시 활성화할 수 있다. 이 기능은 SDK 사용법부터 코드형 인프라(IaC), IAM, CloudWatch, Bedrock 등 핵심 서비스의 최적화된 작업 절차를 포함한다. 별도의 URL 설정이나 네트워크 페치 과정 없이 기본 런타임에서 즉시 불러오는 구조이므로 설정 오버헤드가 없다. 분석, 데이터베이스, EC2, 네트워킹, 보안, 서버리스, 스토리지 등 서비스별 심층 워크플로우를 제공하여 모델 성능 테스트와 스킬 최적화에 집중할 수 있는 환경을 제공한다.

한국 AI 현장에서 볼 지점

국내 AI 개발 현장에서도 프로토타입의 서비스 전환 시 발생하는 인프라 구축 병목은 고질적인 문제였다. AgentCore harness는 배포 과정을 API 호출로 단순화해 개발자가 인프라 설정보다 지능 구현에 더 많은 시간을 할당할 수 있게 한다.

특히 기업 환경에서 필수적인 보안 요구사항과 멀티 모델 운영 전략을 인프라 수정 없이 설정만으로 실험할 수 있다는 점이 핵심이다. 격리된 런타임과 자동화된 자격 증명 관리를 통해 보안 리스크를 줄이는 동시에, 작업 성격에 맞는 최적의 모델을 유연하게 교체하며 성능을 검증할 수 있다.

개발자는 이제 컨테이너 빌드나 오케스트레이션 코드 작성 같은 반복적인 작업에서 벗어나, 실제 비즈니스 가치를 결정짓는 스킬셋의 정교함과 에이전트의 핵심 로직 최적화에 집중하는 개발 환경을 확보하게 된다.

개인 노트북의 프로토타입을 서비스 환경으로 옮길 때 마주하는 인프라 구축의 고통은 `CreateHarness`와 `InvokeHarness` API 호출로 대체된다. 세션 중간에 모델 제공자를 변경해도 대화 맥락이 유지되는 구조는 특정 모델에 종속되지 않는 유연한 운영 환경을 제공한다.

개발자는 이제 오케스트레이션 코드 작성과 컨테이너 빌드 시간을 줄이고 모델 성능 테스트와 스킬 최적화라는 핵심 로직에만 집중할 수 있다. 인프라 구축이라는 물리적 제약이 사라진 자리에서 에이전트의 실질적인 성능을 결정짓는 것은 결국 스킬셋의 정교함이다.