발표에서 확인된 핵심 사실

AI에게 내 취향이나 프로젝트 상황을 매번 다시 설명하는 일은 번거로운 작업이다. Supermemory는 대화 속에서 중요한 사실을 스스로 찾아내 사용자 프로필을 만드는 메모리 및 컨텍스트 레이어다. 대화 중 나오는 단편적인 정보를 추출해 지식을 업데이트하고, 서로 충돌하는 내용은 정리하며, 오래된 정보는 자동으로 지우는 망각 기능을 수행해 대화가 끊기면 기억을 잃는 AI의 한계를 보완한다.

개발자는 단일 API 하나로 메모리와 RAG(외부 데이터를 찾아 답변에 활용하는 기술), 사용자 프로필, 커넥터 기능을 모두 추가할 수 있다. 벡터 DB(AI가 이해하는 숫자로 데이터를 저장하는 저장소)를 따로 설정하거나 임베딩 파이프라인(글자를 숫자로 바꾸는 과정), 청킹 전략(긴 글을 적절한 크기로 자르는 방법)을 짤 필요가 없어 개인화된 AI 에이전트를 구현하는 개발 공수를 줄였다.

Vercel AI SDK, LangChain, LangGraph, OpenAI Agents SDK, Mastra, Agno, n8n 같은 도구들을 위한 드롭인 래퍼(기존 코드에 바로 끼워 넣는 도구)를 제공한다. Claude Code, Cursor, VS Code, OpenCode, OpenClaw, Hermes 등에서 쓸 수 있는 MCP(AI가 데이터에 접근하는 표준 규격) 서버와 플러그인도 지원해 개발 환경에 맞춰 메모리, 리콜, 컨텍스트 도구를 즉시 연결해 쓸 수 있다.

Memory와 RAG를 결합한 Hybrid Search

Supermemory는 지식 베이스 문서와 개인화된 맥락을 한 번에 찾아내는 하이브리드 서치(Hybrid Search)를 제공한다. RAG와 메모리를 단일 쿼리로 묶어 처리하는 방식이다. 기존에는 문서 검색과 개인 기억을 따로 처리해야 했지만, 하나의 요청으로 두 정보를 모두 가져와 사용자가 배경 설명을 덧붙이지 않아도 AI가 맥락을 파악한다.

사용자 프로필은 변하지 않는 고정 정보와 최근 활동 내역을 자동으로 업데이트하며 유지한다. 이 정보를 불러오는 속도는 약 50ms 수준으로, 사용자의 기본 성향과 현재 상태를 동시에 파악해 답변에 반영한다.

성능 지표에서는 LongMemEval 81.6%를 기록하며 LoCoMo, ConvoMem 등 주요 AI 메모리 벤치마크 3종에서 모두 1위를 차지했다. 자체 개발한 오픈소스 벤치마크 프레임워크인 MemoryBench를 함께 공개했으며, 전체 코드는 MIT 라이선스(누구나 자유롭게 수정하고 사용할 수 있는 소프트웨어 허가 방식)로 제공된다.

외부 서비스 커넥터와 멀티모달 추출기를 통한 데이터 자동화

이렇게 구축된 메모리 시스템은 다양한 외부 데이터를 통해 더욱 풍성해진다. Supermemory는 구글 드라이브, 지메일, 노션, 원드라이브, 깃허브를 실시간 웹훅(데이터 변경 시 즉시 알림을 보내는 방식)으로 자동 동기화한다. PDF나 이미지의 글자를 읽어내는 OCR(광학 문자 인식), 비디오의 음성을 텍스트로 바꾸는 전사, 코드의 논리 구조를 분석해 적절한 크기로 나누는 AST(추상 구문 트리) 인식 청킹 기술을 내장해 텍스트, 이미지, 영상, 코드를 AI가 이해할 수 있는 데이터로 자동 변환해 저장한다.

인프라 설정 과정도 간소화했다. 프로그램 실행에 필요한 모든 구성 요소를 하나로 묶은 단일 바이너리(설치 과정 없이 파일 하나로 실행되는 프로그램) 형태로 제공되어 `localhost:6767` 주소에서 즉시 동작한다. 복잡한 라이브러리 설치나 환경 변수 설정 과정이 생략되어 별도의 준비 없이 도구를 실행할 수 있다. 여기에 Ollama(내 컴퓨터에서 거대언어모델을 돌리는 도구)를 연동하면 외부 네트워크 연결 없이 완전 오프라인 상태에서도 사용할 수 있어 보안이 중요한 환경에서도 개인화된 메모리 시스템을 구축할 수 있다.

AI에게 내 상황을 매번 다시 설명하는 번거로움은 이제 과거의 일이 된다. Supermemory는 대화 속 사실을 스스로 추출해 업데이트하며, 데이터를 좌표로 변환해 저장하는 벡터 DB 설정 없이 API 하나로 기억과 정보 검색을 동시에 처리한다.

LongMemEval 81.6%의 정확도와 50ms라는 찰나의 호출 속도는 실시간 개인화의 기준을 바꾼다. 데이터를 AI가 이해하는 숫자로 바꾸는 임베딩 파이프라인이라는 복잡한 설계 과정을 걷어낸 만큼, 개발자는 이제 에이전트의 지능 그 자체에만 집중할 수 있다.