"Companies will have orders of magnitude more agents than human beings,"

로완 트롤로프(Rowan Trollope) Redis CEO가 벤처비트() 인터뷰에서 던진 말이다. 그는 인간보다 수십 배 더 많은 AI 에이전트가 투입되면 백엔드 시스템의 부하가 기하급수적으로 증가할 것이라는 점을 경고했다. 과거 모바일 시대에 캐싱 레이어로 시스템 붕괴를 막았던 Redis가 이제는 AI 에이전트 시대를 위한 새로운 데이터 지형을 설계한다.

에이전트는 인간 사용자보다 훨씬 더 많은 데이터 요청을 생성한다. 하지만 기존의 검색 레이어는 인간 규모의 요청을 처리하도록 설계되어 있어, 에이전트가 생성하는 방대한 트래픽을 흡수하지 못하고 병목 현상을 일으킨다. Redis는 이 구조적 간극을 메우기 위해 에이전트와 데이터 사이의 완충 지대 역할을 하는 컨텍스트 및 메모리 플랫폼을 제안한다. 단순한 검색 증강 생성(RAG, Retrieval-Augmented Generation)을 넘어, 에이전트가 런타임에 필요한 정보를 직접 호출해 사용하는 '컨텍스트 아키텍처'로의 전환이 시작됐다.

Redis Iris, 5개 핵심 컴포넌트로 구성된 컨텍스트 플랫폼

에이전트가 생성하는 데이터 요청량은 인간 사용자의 그것과 차원이 다르다. Redis는 이 구조적 간극을 메우기 위해 월요일 Redis Iris를 출시했다. 이는 단순한 캐시 계층을 넘어 에이전트와 데이터 사이의 컨텍스트 및 메모리 플랫폼을 지향한다. 기존의 리트리벌 파이프라인은 단일 쿼리에 최적화되어 에이전트가 쏟아내는 방대한 요청 부하를 감당하지 못했다. Redis는 데이터 통합부터 메모리, 저장 엔진까지 하나로 묶어 에이전트의 데이터 요청 병목을 해결하겠다는 판도를 짰다.

데이터 통합의 최전선에는 Redis Data Integration(RDI)이 배치된다. RDI는 변경 데이터 캡처(CDC, Change Data Capture) 파이프라인를 통해 Oracle, Snowflake, Databricks, Postgres의 데이터를 실시간으로 동기화하며 현재 GA(General Availability, 정식 출시) 상태다. 이어지는 Context Retriever(프리뷰)는 pydantic 모델 기반으로 비즈니스 데이터의 시맨틱 모델을 정의한다. 이를 통해 MCP(Model Context Protocol, 모델 컨텍스트 프로토콜) 도구를 자동 생성하며 에이전트가 필요한 데이터를 직접 쿼리하게 만든다. 이는 기존 RAG가 데이터를 파이프라인에 미리 밀어 넣던 방식에서 에이전트가 런타임에 데이터를 당겨오는 방식으로의 지형 변화를 의미한다.

세션 간의 연속성을 보장하는 것은 Agent Memory(프리뷰)의 역할이다. 단기 및 장기 상태를 저장해 에이전트가 매 턴마다 맥락을 재도출해야 하는 비효율을 제거했다. 이 모든 데이터 처리의 하부 구조는 Redis Flex라는 재설계된 저장 엔진이 지탱한다. Redis Flex는 데이터의 99%를 SSD에 배치하고 1%만 RAM에 할당하는 구조를 채택했다. 이를 통해 페타바이트 규모의 검색에서도 서브 밀리초(sub-millisecond) 수준의 지연 시간을 구현했다. 인메모리 저장소 단독 사용 대비 비용을 10분의 1로 낮추면서도 성능을 보전하는 전략적 포석이다.

플랫폼의 완성도는 Redis Search와 LangCache가 결정한다. 이들은 시맨틱 캐싱의 중추로서 중복된 모델 호출을 획기적으로 줄이는 역할을 수행한다. LangCache는 프롬프트 응답을 캐싱하여 LLM 호출 횟수를 최적화하고 응답 속도를 높인다. 결과적으로 다섯 가지 핵심 컴포넌트의 통합은 에이전트가 실제 작동하는 순간에 필요한 라이브 컨텍스트와 메모리를 저지연으로 확보하게 만든다. 이는 인프라 수준에서 에이전트의 운영 비용을 낮추고 실행 속도를 높이는 실질적인 비즈니스 임팩트를 겨냥한다.

'Push' 방식의 RAG에서 'Pull' 방식의 컨텍스트 아키텍처로

기존 RAG(검색 증강 생성, Retrieval-Augmented Generation)는 모델을 호출하기 전 데이터를 파이프라인에 미리 밀어 넣는 방식이다. 개발자가 예상 질문에 맞춰 데이터를 미리 준비해 제공하는 Push(푸시) 구조다. 하지만 에이전트가 실제 서비스에 투입되는 환경에서는 이 방식이 곧바로 한계에 부딪힌다. 에이전트는 인간 사용자보다 수십 배, 수백 배 많은 데이터 요청을 생성하기 때문이다. 미리 준비한 데이터셋만으로는 에이전트가 만들어내는 방대한 요청량을 물리적으로 감당할 수 없다. 런타임에 필요한 데이터를 직접 호출하는 Pull(풀) 방식의 컨텍스트 아키텍처가 대안으로 부상한 배경이다.

컨텍스트 아키텍처는 에이전트가 실행 중에 도구 호출을 통해 필요한 데이터를 직접 가져온다. 데이터를 미리 예측해 채워 넣는 것이 아니라 실시간으로 필요한 정보만 정밀하게 인출하는 구조다. 이는 매번 식료품점에 가서 재료를 사는 대신 냉장고에 필요한 만큼의 음식을 보관하고 즉시 꺼내 쓰는 것과 같다. 에이전트는 스스로 미들웨어(중간 소프트웨어)를 작성하거나 데이터베이스 관리자와 협의해 쿼리를 하드코딩할 수 없다. 따라서 런타임에 즉시 접근 가능한 인터페이스가 미리 구축되어 있어야만 작동한다. 데이터 레이어를 미리 로드된 페이로드(전송 데이터 단위)가 아닌 라이브 리소스로 취급하는 지형 변화다.

시장 지표는 이러한 구조적 전환의 속도를 증명한다. 2026년 1분기 VB Pulse RAG 인프라 시장 트래커(VB Pulse RAG Infrastructure Market Tracker)에 따르면 하이브리드 검색 도입 의향은 1월 10.3%에서 3월 33.3%로 세 배 이상 급증했다. 자체 구축 검색 스택 비중 역시 24.1%에서 35.6%로 증가했다. 기성 솔루션의 범용적인 기능만으로는 에이전트의 복잡한 요구사항과 기업 내부의 특수한 데이터 구조를 충족하기 어렵다는 판단이 작용한 결과다. 검색 최적화는 이제 평가 단계의 부수적인 작업이 아니라 기업의 최우선 투자 순위로 등극했다.

단순히 RAG의 성능을 개선하는 차원의 문제가 아니다. 에이전트가 실제 업무를 수행하는 순간에 필요한 라이브 컨텍스트와 메모리를 얼마나 빠르게 제공하느냐가 비즈니스 임팩트를 결정한다. 기업들은 이제 모델의 토큰 수나 추론 성능보다 거버넌스가 확보된 저지연 컨텍스트 확보에 집중하고 있다. 데이터 모델과 관계, 접근 규칙을 정의하는 시맨틱 레이어(의미론적 계층)가 단순한 설정값이 아닌 핵심 생산 인프라로 격상됐다. 이는 에이전트 시대의 데이터 주도권을 잡기 위한 전략적 포석이다. 여전히 기존의 RAG 파이프라인 최적화에 매달리는 팀은 이미 지난 해의 문제를 풀고 있는 셈이다.

거버넌스 확보와 실시간 컨텍스트가 가르는 에이전트 생존력

1시간 분량의 그룹 치료 세션에서 발화자별 맥락을 실시간으로 추적하고 적시에 정보를 제공하는 작업은 단순한 검색의 영역이 아니다. Mangoes.ai(실시간 음성 AI 플랫폼)는 이 복잡한 세션 상태를 관리하기 위해 Redis Iris의 동적 메모리 기능을 도입했다. 검색과 메모리, 세션 상태를 Redis 기반으로 통합 운영함으로써 서로 다른 도구들을 이어 붙일 때 발생하는 결합 비용을 완전히 제거했다. 개발자가 개별 툴의 API를 맞물려 통신을 기대하던 기존의 파편화된 구조에서 벗어나 인프라 수준에서 데이터 흐름을 단일화한 사례다. 이는 실시간성이 생명인 의료 현장에서 컨텍스트의 단절이 곧 서비스 품질의 저하로 이어진다는 판단에 근거한다.

이러한 실시간 컨텍스트 확보 전략은 데이터 지형의 접점을 넓히는 비즈니스 포석으로 이어진다. Redis는 Snowflake(클라우드 데이터 플랫폼) 마켓플레이스에 Iris를 출시하고 네이티브 커넥터를 제공하며 기업 데이터의 진입 장벽을 낮췄다. 기존의 레거시 데이터베이스를 완전히 대체하는 파괴적 전략이 아니라, 그 위에 저지연 컨텍스트 레이어를 얹어 활용도를 높이는 상생 전략을 취한다. 에이전트가 런타임에 필요한 데이터를 직접 끌어오는 구조로 전환하면서, 데이터 요청 횟수가 폭증하는 에이전트 시대의 백엔드 부하 문제를 해결하려는 의도다. 이는 데이터 저장소와 실행 환경 사이의 물리적, 논리적 거리를 좁히는 작업이다.

시장 전체의 승패는 이제 모델의 추론 성능이 아니라 거버넌스 통제력에서 갈린다. HyperFRAME Research(AI 스택 분석 기관)는 에이전트가 기업 내에서 통제 불가능한 비용 센터가 되거나 새로운 데이터 접근 리스크를 창출하는 상황을 핵심 변수로 꼽는다. 특히 거버넌스 예외 처리를 얼마나 정교하게 수행하느냐가 시장의 생존력을 결정짓는 척도가 된다. 보안 규칙이 적용되지 않은 채 무분별하게 데이터에 접근하는 에이전트는 기업 입장에서 효율적인 도구가 아니라 관리 불가능한 리스크일 뿐이다. 결국 비용과 보안이 완전히 통제된 상태에서 저지연 컨텍스트를 제공하는 레이어가 에이전트 생태계의 표준이 된다.

결과적으로 시맨틱 레이어의 인프라화는 선택이 아닌 필수적인 생존 전략이 된다. 비즈니스 엔티티의 정의, 데이터 간의 관계, 그리고 세밀한 액세스 규칙을 관리하는 시맨틱 레이어는 이제 단순한 설정 파일의 수준을 넘어섰다. 이를 데이터 파이프라인처럼 버전 관리하고 유지보수하는 체계적인 운영 프로세스가 필요하다. 대부분의 기업이 모델 튜닝에 집중할 때, 정작 중요한 것은 비즈니스 로직을 데이터 레이어에 어떻게 투영하고 관리할 것인가 하는 지점이다. 시맨틱 레이어를 인프라 수준에서 체계적으로 관리하는 역량이 에이전트의 실질적인 비즈니스 임팩트를 결정하는 최후의 보루가 된다.