49.1%. 이 수치는 GBrain이 자체 벤치마크인 BrainBench에서 기록한 P@5(Precision at 5) 정밀도다. 단순한 벡터 검색에 지식 그래프 레이어를 더한 것만으로, 에이전트가 정답을 찾아내는 정확도가 비약적으로 상승한 셈이다. 그런데 우리는 왜 지금까지 에이전트의 기억력을 단순히 임베딩 벡터의 유사도에만 의존해 왔는가.
매번 세션이 종료될 때마다 모든 맥락을 잃어버리는 것이 대부분의 AI 에이전트가 가진 고질적인 문제다. 지난주에 누구를 만났고, 어떤 결정을 내렸는지 기억하기 위해 매번 방대한 문서를 다시 읽히거나, 부정확한 벡터 검색 결과에 의존해야 했다. Y Combinator(미국의 유명 액셀러레이터)의 회장 가리 탄은 자신의 OpenClaw와 Hermes 배포 환경에서 사용할 실제 '두뇌'가 필요했고, 그 결과물이 바로 GBrain이다. 이 시스템은 단순한 데이터베이스가 아니라 마크다운 파일을 기본으로 하며, 그 위에 타입이 지정된 지식 그래프를 자동으로 구축하는 지식 레이어다.
가리 탄이 실제로 운영 중인 프로덕션 브레인에는 현재 146,646개의 페이지, 24,585명의 인물, 5,339개의 기업 정보가 담겨 있다. 놀라운 점은 이 거대한 지식 그래프를 구축하는 과정에서 LLM 호출이 단 한 번도 발생하지 않는다는 것이다. 오직 정규표현식과 타입 추론만으로 관계를 엮어내며, 이를 통해 '누가 어디서 일하는가' 같은 구조적 질문에 대해 벡터 유사도가 아닌 확정적인 엣지 탐색으로 답을 내놓는다. 이는 에이전트 설계의 패러다임을 '더 큰 모델'에서 '더 정교한 외부 기억 장치'로 옮기는 실무적인 접근을 보여준다.
GBrain v0.38.2.0, 14만 페이지 규모의 지식 레이어 공개
기존의 많은 AI 에이전트는 세션을 시작할 때마다 이전의 맥락을 상실하는 이른바 제로 베이스 상태에 놓인다. 가리 탄(Garry Tan)이 개발한 GBrain은 이러한 기억력의 한계를 극복하기 위해 설계된 오픈소스 지식 레이어다. 이 도구는 마크다운(Markdown) 기반의 파일 시스템을 마크다운 우선(Markdown-first) 방식으로 관리하며, 포스트그레스(Postgres)를 백엔드로 활용해 데이터를 구조화한다. 최신 버전인 v0.38.2.0은 실무 환경에서의 안정성과 확장성을 검증받은 상태로, MIT 라이선스로 공개되어 누구나 자신의 에이전트 시스템에 통합할 수 있다. 프로젝트의 상세 정보와 소스 코드는 GitHub 저장소에서 확인할 수 있다.
실제 운영 규모에서 GBrain의 실무 적용 가능성은 명확히 관찰된다. 현재 가리 탄이 자신의 OpenClaw 및 Hermes 에이전트 운영에 사용하는 GBrain 인스턴스는 146,646개의 페이지를 관리하며, 24,585명의 인물과 5,339개의 기업 정보를 연결하고 있다. 특히 66개의 자율 크론 잡(cron jobs)이 백그라운드에서 상시 작동하며 지식 그래프를 최신 상태로 유지한다. 주목할 점은 이 방대한 지식 그래프 추출 과정에서 대규모 언어 모델(LLM) 호출을 전혀 사용하지 않는다는 것이다. 대신 정규 표현식과 타입 추론을 결합한 결정론적 방식을 채택하여 비용 효율성과 속도를 동시에 확보했다.
번(Bun, 자바스크립트 런타임) 환경에서 구동되도록 최적화된 GBrain은 기술적 구현 측면에서 매우 효율적이다. 설치 과정은 매우 간소화되어 있으며, 다음과 같은 명령어를 통해 즉각적인 환경 구축이 가능하다.
bun install -g @garrytan/gbrain이후 gbrain init --pglite 명령을 실행하면 PGLite(WASM으로 컴파일된 포스트그레스)를 통해 별도의 서버나 도커(Docker) 설정 없이 로컬 환경에 데이터베이스를 즉시 생성할 수 있다. 이러한 아키텍처는 복잡한 인프라 구축 없이도 개발자가 즉시 지식 레이어를 도입할 수 있게 한다. 브레인벤치(BrainBench) 벤치마크 결과에 따르면, 지식 그래프 레이어를 활성화했을 때 P@5(Precision at 5) 지표가 비활성화 상태 대비 31.4포인트 상승한 49.1%를 기록했다. 이는 단순 벡터 검색을 넘어 구조화된 데이터 탐색이 에이전트의 검색 정확도에 실질적인 기여를 함을 입증한다. 6개월 뒤 실제 프로덕션 코드에 이 구조를 이식할 경우, 에이전트의 기억력은 단순한 토큰 컨텍스트를 넘어 정교하게 연결된 지식 그래프의 형태로 진화할 것으로 예측된다.
LLM 없이 구축하는 지식 그래프와 PGLite(WASM 기반 Postgres)의 결합
도커(Docker) 설치와 서버 설정에 소요되는 시간은 개발자가 로컬 환경에서 데이터베이스를 구축할 때 가장 먼저 마주하는 장벽이다. GBrain은 이 과정을 PGLite(WASM으로 컴파일된 풀 포스트그레스)를 통해 해결한다. PGLite는 포스트그레스 17 버전을 웹어셈블리(WASM, 웹 브라우저나 런타임에서 실행 가능한 바이너리 포맷)로 컴파일하여 서버나 별도의 컨테이너 환경 없이도 약 2초 내에 준비되는 구조를 가진다. 설치 과정은 매우 단순하며 다음 명령어로 수행된다.
bun install -g gbrain이후 아래 명령어를 실행하면 ~/.gbrain/. 경로에 로컬 PGLite 데이터베이스가 즉시 프로비저닝된다.
gbrain init --pglite마크다운 파일이 데이터의 기본 단위이며, 지식 그래프의 연결 고리는 위키링크(wikilinks) 형식을 통해 정의된다. 각 파일은 상단에 현재의 최선 이해도를 기록하고 하단에 추가 전용 증거 경로를 남기는 컴파일된 진실 및 타임라인 패턴을 따른다. 여기서 주의할 점은 링크 작성 시 반드시 전체 슬러그 경로를 포함해야 한다는 사실이다. 예를 들어 [[alice-chen]]과 같은 단축 형태가 아니라 [[people/alice-chen]]처럼 명확한 경로를 지정해야 그래프 추출기가 이를 정상적으로 인식한다. 경로가 누락된 단축 형태의 링크는 오류를 발생시키지 않고 조용히 무시되므로 데이터 무결성을 위해 엄격한 경로 지정이 요구된다.
그래프 추출 과정에서 LLM(거대언어모델)을 전혀 호출하지 않는다는 점이 가장 주목할 지점이다. GBrain은 순수 정규표현식(Regex)과 타입 추론만을 사용하여 엔티티 간의 관계를 정의한다. 추론 프로세스는 정해진 캐스케이드(Cascade, 단계적 폭포수) 순서에 따라 작동하며 FOUNDED, INVESTED, ADVISES, WORKS_AT, MENTIONS 순으로 우선순위를 두고 관계를 매핑한다. 예를 들어 텍스트 내에서 창업자라는 표현이 발견되면 FOUNDED 관계를 먼저 설정하고, 이후 고용 관계나 단순 언급 순으로 추론을 확장하는 방식이다. 모델이 루프에 참여하지 않으므로 추출 결과가 결정론적이며 API 비용이 발생하지 않는다.
단순한 벡터 검색의 한계를 극복하는 실무적 가치를 제공하는 것이 이 구조적 접근의 핵심이다. 특정 인물이 어느 회사에 근무하는지 찾는 작업은 유사도 점수를 계산하는 벡터 검색이 아니라 타입이 지정된 엣지(Edge, 그래프의 연결선)를 한 번 따라가는 트래버설(Traversal, 횡단) 작업으로 변환된다. 이는 BrainBench 벤치마크에서 그래프 레이어를 비활성화했을 때보다 P@5(상위 5개 결과의 정밀도) 수치를 31.4포인트 높이는 결과로 이어진다. 모델의 확률적 추론에 의존하지 않고 결정론적인 규칙 기반의 그래프를 구축함으로써 검색의 정확도와 제어권을 동시에 확보한 설계라고 관찰된다.
벡터 검색 vs 구조적 검색, P@5 31.4%p의 성능 격차
단순 유사도 검색의 한계는 개발팀이 공개한 벤치마크 수치에서 명확히 드러난다. 240페이지의 풍부한 산문 코퍼스로 구성된 BrainBench 테스트 결과, GBrain은 P@5 49.1%와 R@5 97.9%라는 성적을 기록했다. 주목할 점은 그래프 레이어를 비활성화했을 때와 비교해 P@5 기준 31.4포인트의 성능 향상이 관찰된다는 사실이다. 이는 단순한 임베딩 유사도 비교가 아니라 타입 기반의 엣지 탐색이라는 구조적 검색이 실제 정밀도에 결정적인 영향을 미친다는 것을 증명한다. 기존의 벡터 검색이 질문과 유사한 맥락의 텍스트 뭉치를 찾는 방식이라면, 구조적 검색은 정의된 관계를 따라 정답에 도달한다. 예를 들어 특정 인물이 어느 회사에 근무하는지 찾는 질문은 유사도 점수를 계산하는 확률적 과정이 아니라, 단 한 번의 타입 엣지 트래버설(Typed-edge traversal, 정의된 관계를 따라 노드를 이동하는 방식)로 해결되는 결정론적 과정으로 변모한다.
벡터 검색과 키워드 검색을 정교하게 결합한 하이브리드 파이프라인이 이러한 정밀도를 뒷받침한다. GBrain은 pgvector의 HNSW(Hierarchical Navigable Small World, 고속 근사 최근접 이웃 검색 알고리즘)를 통한 벡터 검색과 BM25(Best Matching 25, 문서 내 단어 빈도 기반의 랭킹 함수)를 병행 운용한다. 서로 다른 성격의 검색 결과는 RRF(Reciprocal Rank Fusion, 여러 검색 결과의 순위를 통합하는 알고리즘)를 통해 최종 점수로 환산된다. 이때 적용되는 RRF 공식은 다음과 같다.
score = sum(1 / (60 + rank))
각 검색 엔진이 내놓은 순위의 역수를 활용하는 RRF는 단순한 가중치 합산 방식과 달리, 특정 알고리즘이 비정상적으로 높은 점수를 부여해 전체 결과를 왜곡하는 현상을 방지한다. 결과적으로 벡터의 의미론적 탐색과 BM25의 정확한 키워드 매칭이 상호 보완하며 검색의 재현율과 정밀도를 동시에 끌어올리는 구조를 취한다.
검색 모드는 실무 환경에서의 제어권을 위해 conservative, balanced, tokenmax 세 가지 옵션으로 제공된다. 이는 비용과 품질 사이의 트레이드오프를 설정하는 설정값을 단순화하여 개발자가 서비스의 요구사항에 맞게 선택하도록 설계된 것이다. 기본값인 balanced 모드에서는 ZeroEntropy 리랭커(Reranker, 검색 결과의 순위를 재조정하는 모델)가 활성화되어 검색 정밀도를 한 차례 더 보정한다. 단순히 거대언어모델의 추론 능력에만 의존하는 것이 아니라, 정규표현식 기반의 구조적 데이터 추출과 하이브리드 랭킹, 그리고 최종 리랭킹으로 이어지는 다층적 필터링 체계를 구축했다는 점이 핵심이다. 이러한 설계는 검색 결과의 예측 가능성을 높이며, 6개월 뒤 실제 프로덕션 코드에 적용했을 때 디버깅 가능한 검색 경로를 제공한다는 실무적 가치를 지닌다.
MCP 기반 74개 도구 제공, 에이전트의 '쓰기' 권한 확장
모델이 외부 시스템의 상태를 직접 수정하지 못하고 단순히 텍스트를 생성하는 데 그친다는 점은 개발자가 에이전트와 상호작용할 때 가장 큰 병목이다. 이번 업데이트에서 먼저 바뀐 건 도구 연결 방식이다. GBrain은 MCP(Model Context Protocol)를 통해 74개의 도구를 표준화된 인터페이스로 노출하며, 에이전트가 단순히 정보를 읽는 수준을 넘어 지식 저장소에 직접 쓰기 권한을 행사하도록 설계되었다. 이는 에이전트가 판단한 내용을 즉시 마크다운 파일로 기록하거나, 링크를 생성하고, 태그를 관리하는 등 능동적인 지식 관리가 가능해짐을 의미한다.
복잡한 설정 없이 단 한 줄의 명령어로 도구 연동이 즉시 활성화된다. 개발자는 터미널에서 다음 명령어를 입력하는 것만으로 Claude Code를 포함한 주요 개발 환경에 도구 세트를 즉시 탑재할 수 있다.
gbrain mcp add claude-code이 과정에서 제공되는 74개의 도구는 get_page, put_page, search, query, add_link와 같이 직관적인 snake_case 명명 규칙을 따른다. 특히 Cursor나 Windsurf와 같은 IDE(통합 개발 환경)에서 별도의 JSON 설정 파일을 수동으로 편집할 필요 없이 표준 MCP 스펙을 통해 즉각적인 통합이 가능하다는 점은 실무 생산성 측면에서 중요한 변화다. 로컬 환경의 stdio 기반 통신이 기본값이지만, 원격 접속이 필요한 환경에서는 stdio를 HTTP로 전환하여 사용할 수 있도록 설계되어 있어 배포 유연성 또한 확보했다.
에이전트의 '기억'과 '행동'을 물리적으로 결합하는 것이 이러한 도구 노출의 목적이다. 기존에는 에이전트가 검색 결과를 제시하면 사람이 직접 파일을 수정해야 했으나, 이제는 에이전트가 직접 put_page를 호출하여 최신화된 지식을 마크다운 파일에 반영한다. Claude Desktop을 사용하는 경우에도 설정 파일 내에서 동일한 JSON 스펙을 공유함으로써 로컬과 원격 환경 간의 일관된 에이전트 경험을 제공한다. 결과적으로 개발자는 에이전트에게 정보를 제공하는 수동적 역할에서 벗어나, 에이전트가 스스로 지식을 구조화하고 관리하는 워크플로우를 구축할 수 있게 된다.
'Thin Harness, Fat Skills' 전략과 한국 AI 실무의 시사점
응답 속도보다 제어권이 개발자가 바로 체감하는 변화다. 그동안 AI 에이전트 구축은 거대 모델의 추론 능력에 전적으로 의존하는 'Fat Agent' 방식이 주류였다. 그러나 GBrain이 제시하는 'Thin Harness, Fat Skills' 철학은 정반대의 접근을 취한다. 런타임 환경은 최소한의 제어 장치(Thin Harness)로 유지하고, 에이전트의 지능을 결정짓는 핵심 데이터는 마크다운(Markdown) 파일이라는 범용적이고 투명한 저장소(Fat Skills)에 축적하는 방식이다. 이는 한국의 기업 환경에서 데이터 주권을 확보하고, 모델 교체에 따른 리스크를 최소화하려는 실무자들에게 실질적인 대안이 된다.
작업의 성격에 따른 엄격한 분리가 이 구조의 핵심이다. 데이터의 동기화, 추출, 임베딩, 통합, 합성으로 이어지는 자동 유지보수 사이클은 gbrain autopilot을 통해 수행된다. 이때 결정론적 작업은 Minions 큐가 담당하고, 판단이 필요한 복잡한 작업은 LLM 서브 에이전트가 처리한다. 특히 gbrain autopilot --follow 명령어를 통해 에이전트의 상태를 지속적으로 최적화하는 과정은, 사람이 직접 마크다운 파일을 수정할 수 있는 시스템 오브 레코드(System of Record)를 유지하기에 가능하다. 에이전트가 생성한 지식 그래프를 인간이 언제든 열어보고 수정할 수 있다는 점은 기존의 블랙박스형 RAG(검색 증강 생성) 시스템과는 차별화되는 지점이다.
gbrain autopilot --follow에이전트가 문맥을 잃어버리는 '세션 제로(Session Zero)' 현상은 한국의 많은 실무 현장에서 고민하는 핵심 과제다. GBrain은 마크다운 파일 기반의 지식 그래프를 통해 에이전트가 과거의 미팅, 이메일, 결정 사항을 영구적인 컨텍스트로 상속받게 한다. 이는 단순히 벡터 검색의 정확도를 높이는 수준을 넘어, 구조화된 지식 그래프를 통해 에이전트의 판단 근거를 명확히 하는 과정이다. 모델 성능에만 의존하지 않고 외부 지식 저장소를 고도화하는 이 전략은, 기업 내부의 파편화된 문서 자산을 AI가 즉각 활용 가능한 지능형 자산으로 전환하려는 시도와 맞닿아 있다. 결국 에이전트의 지능은 모델의 파라미터 수가 아니라, 에이전트가 읽고 쓰는 마크다운 파일의 품질과 그 위에서 작동하는 구조화된 검색 파이프라인에 의해 결정된다는 사실이 이번 사례를 통해 관찰된다.




