6개. CodeBoarding의 핵심 기능을 수행하는 컴포넌트 수다. 복잡한 코드베이스를 분석해 지도로 그려내기 위해 필요한 최소한의 전문 부품 세트와 같다. 그런데 단순히 그림을 그리는 도구가 아니다. 개발자들은 대규모 프로젝트에 투입될 때마다 수만 줄의 코드를 읽으며 머릿속으로 아키텍처를 그려야 하는 고통을 겪는다. 최근에는 AI 에이전트가 코드를 대신 짜주기 시작했지만, 정작 이 AI가 전체 시스템 구조를 제대로 이해하고 짰는지는 알 길이 없다. AI가 짠 코드가 겉으로는 돌아가도 내부적으로는 아키텍처를 망가뜨리는 '숨은 기술 부채'가 될 위험이 커진 것이다. 이제는 코드를 짜는 주체가 사람이 아니라 AI 에이전트로 확장되었기에, 인간과 AI가 동일한 시각적 모델을 공유하며 소통하는 인터페이스가 필수적인 타이밍이 됐다. CodeBoarding은 정적 분석과 LLM 추론을 결합해 사람과 AI가 동시에 볼 수 있는 '코드 지도'를 자동으로 그려줌으로써 이 간극을 메운다.
8개 언어 지원과 3가지 배포 경로의 CodeBoarding
변화는 천천히 오지 않았다. 개발자가 수작업으로 그리던 아키텍처 다이어그램을 정적 분석과 LLM(대규모 언어 모델)이 대신 그리는 단계로 빠르게 넘어왔다. CodeBoarding(코드보딩)은 이 과정을 자동화해 코드베이스의 시각적 지도와 문서를 생성한다. 정적 분석으로 코드의 물리적 구조를 파악하고 LLM의 추론 능력을 결합해 고수준 아키텍처를 도출하는 방식이다. 수동 문서화 작업에 소요되던 시간을 분석 자동화로 압축했다.
지원 범위는 Python, TypeScript, JavaScript, Java, Go, PHP, Rust, C#까지 총 8개 언어로 구성된다. 특정 환경에 종속되지 않도록 LLM 프로바이더 선택지도 넓혔다. OpenAI, Anthropic, Google 같은 주요 모델은 물론, Vercel AI Gateway(LLM 라우팅 서비스)와 AWS Bedrock(클라우드 AI 플랫폼)을 연동할 수 있다. 로컬 환경에서 모델을 직접 실행하는 Ollama(로컬 LLM 실행 도구)와 통합 API 인터페이스인 OpenRouter까지 지원 목록에 포함된다. 개발자는 기업의 보안 정책이나 비용 기준에 맞춰 추론 엔진을 선택해 사용할 수 있다.
배포 경로는 세 가지로 나뉜다. 로컬 분석과 자동화, CI 워크플로우를 위한 CLI(명령줄 인터페이스) 방식이 있으며, bash pipx install codeboarding 명령어로 설치한다. 에디터 내에서 시각적 아키텍처를 즉시 확인하는 VS Code 익스텐션과 CI 단계에서 다이어그램을 항상 최신 상태로 유지하는 GitHub Action으로도 제공된다. 분석 결과물은 프로젝트 내 .codeboarding/ 디렉터리에 저장된다. 저장 형태는 Markdown 문서와 Mermaid(텍스트 기반 다이어그램 도구) 다이어그램이다. 이 파일들은 IDE나 PR(풀 리퀘스트), 문서에 그대로 임베드해 사용할 수 있으며 코드와 함께 버전 관리가 가능하다.
MIT 라이선스로 공개되어 누구나 자유롭게 수정하고 배포할 수 있다. 이미 800개 이상의 유명 오픈소스 레포지토리를 시각화한 샘플 데이터베이스를 제공해 도구의 실효성을 보여준다. 생성된 결과물은 GeneratedOnBoardings라는 공개 저장소나 codeboarding.org/diagrams 호스팅 탐색기에서 직접 확인할 수 있다. 사람이 일일이 업데이트하던 문서의 시차를 없애고 AI 에이전트와 사람이 동일한 시각 모델을 공유하는 환경을 구축한다.
증분 업데이트 엔진과 6개 핵심 컴포넌트의 동작 구조
대규모 코드베이스를 분석할 때 가장 먼저 마주하는 벽은 시간이다. 수만 줄의 코드가 얽힌 레포지토리를 매번 처음부터 다시 분석하는 방식으로는 실시간 가시성을 확보할 수 없다. CodeBoarding(코드보딩, AI 기반 코드 지도 생성 도구)은 증분 업데이트 엔진을 도입해 이 문제를 해결했다. 코드의 일부가 변경되면 전체를 다시 읽지 않고 변경된 세그먼트만 식별해 재분석한다. 분석 결과는 캐싱되어 다음 작업에 즉시 활용된다. 대규모 레포지토리에서도 분석 속도를 최적화해 개발자가 코드 변경 직후 아키텍처의 변화를 바로 확인할 수 있게 만들었다.
전체 동작은 6개의 핵심 컴포넌트가 유기적으로 맞물리며 수행된다. Application Orchestrator & Repository Manager(애플리케이션 오케스트레이터 및 레포지토리 매니저)는 분석의 진입점으로서 전체 워크플로우를 제어하고 레포지토리의 물리적 구조를 관리하며 컨텍스트를 전달한다. LLM Agent Core(LLM 에이전트 코어)는 분석 목적에 맞는 전문 도구를 선택해 호출하는 제어 센터 역할을 수행한다. Agent Tooling Interface(에이전트 툴링 인터페이스)는 LLM이 정적 분석 엔진의 복잡한 API를 직접 다루지 않고도 필요한 정보만 효율적으로 요청할 수 있게 돕는 가교가 된다. Static Code Analyzer(정적 코드 분석기)는 구문 분석을 통해 코드의 실제 의존 관계와 함수 호출 그래프를 추출한다. Incremental Analysis Engine(증분 분석 엔진)은 이 과정에서 중복 분석을 제거하기 위해 이전 분석 결과와 현재 상태를 비교해 변경된 지점만 정적 분석기에 요청하고 그 결과값을 캐싱한다. 최종적으로 Documentation & Diagram Generator(문서 및 다이어그램 생성기)가 분석된 관계망을 마크다운 문서와 Mermaid 다이어그램으로 렌더링한다. 정적 분석의 정확성과 LLM의 추론 능력을 분리해 배치함으로써 분석의 정밀도를 높였다.
실무에서는 AI 에이전트가 작성한 코드가 기존 아키텍처의 원칙을 깨뜨리는지 확인하는 용도로 활용된다. AI가 제안한 변경사항이 전체 시스템의 레이어 구조를 무너뜨리거나 불필요한 의존성을 만드는 경우, 이를 시각화된 지도로 즉시 확인해 기술 부채가 쌓이는 것을 막는다. 대규모 레포지토리를 처음 분석해야 하는 개발자 역시 컴포넌트 분해 기능을 통해 전체 구조에서 세부 구현으로 빠르게 진입할 수 있다. 이러한 성능과 정확도를 증명하기 위해 800개 이상의 유명 오픈소스 레포지토리를 시각화한 샘플 데이터베이스를 구축해 공개했다. 공개 저장소인 GeneratedOnBoardings와 codeboarding.org/diagrams에서 다양한 규모의 프로젝트가 어떻게 시각화되는지 직접 확인할 수 있다. 단순한 시각화를 넘어 인간과 AI가 동일한 코드 지도를 공유하는 표준을 구축하려는 시도다.
단순한 코드 생성을 넘어 전체 저장소의 맥락을 파악해야 하는 AI 소프트웨어 엔지니어링 시대가 왔다. 코드보딩은 AI 에이전트가 방대한 코드베이스의 구조를 시각적 지도로 공유하며 탐색하게 함으로써 기존 LLM의 컨텍스트 제한 문제를 해결한다.
이제 AI의 경쟁력은 개별 함수를 짜는 능력이 아니라 복잡한 시스템의 지도를 읽고 움직이는 내비게이션 능력에서 갈린다. 코드보딩은 AI 에이전트를 단순한 도구에서 협업 가능한 동료로 전환하는 실질적인 인터페이스가 된다.




