facts

이번 발표의 핵심은 AI 에이전트가 의사결정 순간에 필요한 메모리와 데이터, 검색 기능을 통합 제공하는 'AI 데이터 플레인(AI Data Plane)'의 출시이다. 이 플랫폼은 기존의 파편화된 스택을 대체하기 위해 세 가지 핵심 구성 요소를 패키지로 제공한다.

첫 번째는 '에이전트 메모리(Agent memory)'다. 대화 컨텍스트, 구조화된 운영 데이터, 벡터 임베딩을 처리하는 통합 지속성 계층이다. 특히 세션당 토큰 제약(token constraints), 저장된 메모리의 유효 기간(TTL, Time-to-Live) 제한, 에이전트 세션별 컴퓨팅 소비량을 제한하는 미터링 제어(metering controls) 등 가드레일 기능을 포함해 독립형 메모리 서비스와 차별화했다.

두 번째는 '엔터프라이즈 MCP 서버(Enterprise MCP server)'다. 모델 컨텍스트 프로토콜(MCP, Model-Context Protocol) 통합을 위해 기업이 직접 관리할 수 있는 서버를 플랫폼의 일부로 제공한다. 별도의 외부 서비스를 구축할 필요 없이 표준화된 프로토콜을 통해 모델과 컨텍스트를 연결한다.

세 번째는 '에이전트 카탈로그(Agent catalog)'다. Couchbase가 구축한 함수 수준의 도구 카탈로그로, 에이전트가 호출할 수 있는 기능을 플랫폼 내에서 노출하는 역할을 한다. 이는 단순한 메타데이터 카탈로그가 아니라, 에이전트 함수를 호출 가능한 도구로 표면화하는 확장된 MCP의 형태로 작동한다.

해당 플랫폼은 클라우드, 온프레미스, 그리고 네트워크 연결이 끊긴 엣지(Edge) 환경에서 동일하게 작동하며, 로컬 벡터 검색 기능을 디바이스 단위까지 확장한다.

how-it-works

기술적 차별점은 Couchbase의 아키텍처 뿌리가 캐싱(Caching)에 있다는 점이다. Couchbase는 데이터베이스로 진화하기 전 캐시 시스템으로 시작했기에 메모리 우선 아키텍처를 보유하고 있다. 이에 따라 메모리에 데이터를 쓰는 속도가 디스크에 쓰는 속도보다 10배 빠르며, 이는 메모리 워크로드를 디스크 기반 스토리지 위에 얹어 사용하는 일반적인 NoSQL 데이터베이스와 구분되는 지점이다.

동시에 ACID(원자성, 일관성, 고립성, 지속성)를 준수하는 데이터베이스 구조를 유지하여 트랜잭션 워크로드에서도 데이터 무결성을 보장한다. 이러한 구조는 엣지 환경으로 확장되어 'Couchbase Lite'라는 온디바이스 런타임으로 구현된다. Couchbase Lite는 네트워크 연결이 없는 상태에서도 로컬에서 SQL, 전체 텍스트 검색, 벡터 검색을 수행할 수 있다. 이후 연결이 복구되면 독자적인 동기화 메커니즘을 통해 클라우드나 다른 엣지 노드와 양방향으로 데이터를 복제한다.

에이전트 운영 효율 측면에서는 '공유 컨텍스트 캐싱' 방식을 사용한다. 여러 에이전트가 동시에 고객을 응대할 때, 각 에이전트가 동일한 데이터를 개별적으로 검색하고 처리하는 대신 플랫폼이 공유 컨텍스트를 캐싱한다. 이를 통해 중복된 데이터 처리로 인한 토큰 소모를 줄여 토큰 효율성을 높이는 구조다.

implementation-impact

실무자가 주목할 지점은 인프라의 단순화와 지연시간의 예측 가능성이다. 실시간 음성·영상 AI 솔루션을 제공하는 Agora(아고라)의 경우, 기존의 시그널링 제품에서 사용하던 Couchbase를 대화형 AI 에이전트로 확장 적용했다. 이 과정에서 메모리 우선 아키텍처, 전체 JSON 지원, 데이터센터 간 복제 기능을 통해 고가용성을 확보하고, RAG(검색 증강 생성) 구현 시 대화형 AI에 필수적인 낮은 지연시간을 확보했다.

개발자는 이제 컨텍스트 계층을 선택할 때 '워크로드의 성격'과 '거버넌스'를 기준으로 판단해야 한다. 관계 중심의 추론이 핵심이라면 그래프 데이터베이스 같은 특수 엔진이 유리하겠지만, 클라우드부터 모바일 기기까지 동일한 플랫폼으로 메모리를 확장해야 하는 환경이라면 엣지 런타임을 지원하는 통합 플레인이 효율적이다.

특히 오픈소스 솔루션을 직접 최적화하고 유지보수하는 비용과, 엔터프라이즈급 관리형 플랫폼을 도입해 즉시 생산 단계로 진입하는 비용 사이의 트레이드오프를 계산해야 한다. 네트워크 단절이 빈번한 리테일 매장, 현장 서비스, 규제로 인해 데이터가 기기를 벗어날 수 없는 환경에서는 온디바이스 벡터 검색과 양방향 동기화 기능이 운영 제약 사항을 해결하는 핵심 변수가 된다.