지능당 과금(Pay-per-intelligence)과 앰퍼센드의 접근 방식
ChatGPT 같은 AI 에이전트가 유료 API를 사용할 때마다 사람이 직접 결제 수단을 등록하고 한도를 관리해야 하는 번거로움은 개발자와 사용자 모두에게 익숙한 불편이다. 아마존 베드락 에이전트코어 페이먼츠(Amazon Bedrock AgentCore Payments)는 에이전트가 정해진 예산 내에서 자율적으로 결제하는 관리형 결제 인프라를 통해 이 문제를 해결한다. 에이전트가 API를 호출하는 것과 동일한 방식으로 지능 서비스에 대해 즉각적이고 프로그램적으로 결제하는 체계를 구축해, 사람의 승인 없이 필요한 지능 자원을 직접 구매해 사용하는 환경을 만들었다.
앰퍼센드(Ampersend)는 에이전트와 모델 제공자 사이에서 결제 라우팅과 정산 및 운영을 처리하는 관리 플랫폼이다. 이 플랫폼은 `x402`라는 에이전트 결제 프로토콜(에이전트가 프로그램 방식으로 즉시 거래할 수 있게 하는 통신 규약)을 기반으로 작동한다. 에이전트는 연구 논문 요약이나 스마트 계약 검토 같은 작업의 복잡도에 따라 앰퍼센드가 제공하는 모델 카탈로그에서 적절한 계층을 선택하고, 요청당 비용을 지불하는 지능당 과금 방식을 사용한다. 개발자는 개별 모델 제공자와 일일이 구독 계약을 맺을 필요 없이 단일 통합 지점을 통해 여러 모델의 지능을 구매할 수 있다.
에이전트 빌더는 유료 LLM이나 데이터 API를 호출하기 위해 지갑 관리, 결제 서명 구현, 지출 한도 설정 등의 인프라를 직접 구축해야 하며, 이는 핵심 로직 구현 전 상당한 시간이 소요되는 작업이다. 아마존 베드락 에이전트코어 페이먼츠는 이러한 맞춤형 빌링 연동과 자격 증명 관리, 결제 오케스트레이션을 인프라 레이어에서 제공하여 빌더와 서비스 제공자 양측의 인프라 공백을 해결한다.
2단계 결제 라우팅(Two-hop Payment)의 5단계 작동 원리
에이전트가 단 한 번의 요청에 0.05달러라는 소액의 예산을 사용하는 상황을 가정해 보자. 먼저 애플리케이션 백엔드에서 Payment Manager를 생성해 지갑 연결과 지출 정책을 정의한다. 이후 에이전트가 과업을 시작하기 전 Payment Session을 생성하여 해당 세션 내에서만 거래가 가능하도록 제한한다. 이는 에이전트가 자율적으로 모델을 선택하더라도 관리자가 설정한 예산 캡을 넘지 못하게 만드는 제어 장치다.
에이전트가 Ampersend에 추론 요청을 보냈을 때 서버가 HTTP 402(결제 필요) 응답을 반환하면 즉시 결제 프로세스가 시작된다. 에이전트는 응답에 포함된 x402 프로토콜의 세부 정보를 바탕으로 ProcessPayment API를 호출한다. AgentCore는 연결된 지갑의 자격 증명을 사용하여 USDC(미국 달러 가치와 1:1로 연동된 스테이블코인) 승인 서명을 수행하며, 이 과정에서 에이전트는 지갑의 개인 키를 직접 다루지 않고 API 호출만으로 결제 승인을 완료한다.
지갑의 안전한 보관과 서명 인프라는 Credential Provider인 Coinbase Developer Platform(CDP)이 전담한다. 에이전트는 AWS IAM의 `ProcessPaymentRole`이라는 제한적인 역할을 부여받아 실행되며, 이 역할은 오직 ProcessPayment API를 호출할 수 있는 권한만 가진다. 세션 예산을 임의로 수정하거나 지갑의 비밀 키에 직접 접근하는 행위는 시스템적으로 차단되어 결제 권한 남용 가능성을 제거했다.
최종 정산은 Base 네트워크 상에서 USDC로 처리되며 2단계 라우팅 구조를 통해 완료된다. 서명이 완료된 결제 증명이 생성되면 에이전트는 이 증명을 첨부하여 Ampersend에 원래의 요청을 다시 보낸다. Ampersend는 온체인에서 정산 여부를 확인한 뒤 Ampersend SDK를 통해 상위 모델 제공자인 BlockRun에게 대금을 자동 지급한다. 에이전트에서 Ampersend로, 다시 Ampersend에서 모델 제공자로 이어지는 두 번의 정산이 발생하지만 에이전트 입장에서는 단 한 번의 유료 요청을 보낸 것으로 처리된다.
맞춤형 구축 대비 관리형 인프라의 효율성 비교
개발 팀이 AI 에이전트를 위해 직접 지갑 시스템을 구축하려면 수개월의 엔지니어링 시간이 소요된다. 아마존 베드락 에이전트코어 페이먼츠는 이 과정을 Coinbase CDP나 Stripe Privy 지갑 연결로 대체했다. 개발자는 더 이상 지갑 보관 인프라를 직접 설계하거나 복잡한 개인 키 관리 체계를 유지할 필요가 없다. 지출 제어 역시 애플리케이션 백엔드에서 설정한 세션 레벨 예산이 인프라 레이어에서 강제되는 방식으로 작동하여, 한도를 초과하면 다음 결제가 즉시 거부된다.
또한, 결제 처리 과정이 추론 루프를 방해하지 않도록 설계되었다. 인프라가 프로토콜 협상과 지갑 인증, 스테이블코인 결제 및 증명 전달을 자동으로 처리하므로 LLM의 사고 과정이 끊기지 않고 작업을 완수할 수 있다. 기존 방식으로는 결제 요청 시 에이전트의 상태를 저장하고 결제 완료 후 다시 복구하는 복잡한 상태 관리 로직이 필요했으나, 관리형 인프라는 이를 추상화하여 처리한다.
모니터링 효율성도 높였다. 모든 거래 내역은 AgentCore가 제공하는 로그, 메트릭, 트레이스 내에서 통합 확인이 가능하다. 결제 성공 여부와 지출 금액이 일반적인 API 호출 로그와 동일한 경로로 기록되므로, 개발자는 별도의 대시보드를 구축하지 않고도 결제 흐름을 추적할 수 있다. 이러한 관리형 인프라 도입 결과, 지갑 보관과 서명 인프라 및 지출 제어 구축에 예상됐던 3~4개월의 공수가 2주 미만으로 단축되었다.
현장에서 달라지는 비용과 판단
Ampersend는 초기 API 호출부터 Base 네트워크 상의 최종 정산까지 전체 통합 과정을 2주 미만으로 끝냈다. 인프라 구축에 소요되는 시간을 줄여 실제 서비스 로직 구현에 집중한 결과다. 이는 결제 인프라의 표준화가 에이전트의 상용화 속도에 직접적인 영향을 준다는 사실을 보여준다.
기존 방식으로 지갑 보관, 서명 인프라, 지출 제어 시스템을 직접 구축했다면 약 3~4개월의 엔지니어링 공수가 필요했을 것으로 예상된다. 특히 지갑의 개인 키를 안전하게 관리하고 각 모델 제공자의 서로 다른 빌링 체계를 개별적으로 연동하는 작업은 막대한 리소스를 요구한다. 하지만 관리형 결제 인프라를 통해 이 기간을 2주 미만으로 단축하며 엔지니어링 비용을 절감했다.
통합을 주도한 Kevin Jones는 AgentCore와 Ampersend, BlockRun AI의 조합이 매끄럽게 작동했다고 밝혔다. 그는 멀티 에이전트 시스템 구축 과정에서 결제 인프라가 가장 어려운 부분이 될 것이라고 예상했으나, AWS AgentCore Payments가 이 전제를 바꿨다고 언급했다. 로직을 연결하는 것만으로 시스템이 즉시 가동되면서 개발팀은 인프라의 제약 없이 에이전트의 기능을 확장하는 데 집중할 수 있었다.
한국 AI 현장에서 볼 지점
AI 에이전트의 상용화 핵심은 결제 편의성에 있다. 아마존 베드락 에이전트코어 페이먼츠는 에이전트가 정해진 예산 내에서 스스로 결제하는 인프라를 통해 수동 결제 관리 과정을 자동화했다. 개발자가 매번 복잡한 빌링 연동을 처음부터 구축할 필요 없이, 에이전트가 프로그램 방식으로 즉시 거래하는 환경을 구현한 것이다.
단순한 챗봇을 넘어 스스로 서비스를 구매하고 소비하는 에이전틱 커머스(Agentic Commerce)의 실무 구현 방식이 구체화되었다. 핵심은 결정론적 경계(Deterministic Boundaries), 즉 에이전트가 임의로 수정하거나 넘어설 수 없는 엄격한 예산 통제 범위 내에서만 자율성을 부여하는 설계다. 실무자는 모델별 성능과 비용 티어를 세분화하여 구성하고, 에이전트가 과업 복잡도에 따라 최적의 모델을 선택해 결제하게 하는 라우팅 레이어를 도입해 비용 효율을 극대화할 수 있다.
보안과 규제가 엄격한 기업 환경에서는 IAM 역할 기반의 제한적 결제 권한 부여 방식이 유효하다. 전용 역할을 통해 결제 요청은 가능하게 하되, 지갑의 개인 키에 직접 접근하거나 설정된 예산 한도를 수정하는 행위는 불가능하게 설정함으로써 오작동으로 인한 무분별한 지출이나 보안 사고 위험을 차단한다. 결과적으로 결제 인프라의 표준 제공은 개발자가 인프라 난제에서 벗어나 에이전트의 핵심 추론 로직과 서비스 가치 구현에만 집중할 수 있는 환경을 제공한다.
AI 에이전트의 배포 속도는 이제 결제 시스템 구축이라는 물리적 제약이 아니라 추론 로직의 완성도에 의해 결정된다. 인프라 구축 기간을 2주 미만으로 단축할 수 있다는 구체적인 수치를 기준으로 관리형 인프라 도입의 실익을 판단하면 된다.
결제 수단을 직접 등록하고 한도를 관리하던 수동 방식은 x402 프로토콜 기반의 2단계 결제 라우팅으로 대체된다. 이를 통해 보안 인프라 구축에 소요되던 3~4개월의 시간을 2주 미만으로 줄이는 것이 가능해졌다. 개발자는 더 이상 지갑 관리라는 인프라 난제에 시간을 쏟을 필요가 없다.




