한 개발자가 11개의 마이크로서비스와 인프라 전체를 단 9일 만에 구축해 bkamp.ai라는 서비스를 세상에 내놓았다. 혼자서 개발을 진행하며 사용한 도구는 Anthropic의 Claude Code(터미널 기반 AI 코딩 도구)였다. 단순히 AI에게 코드를 짜달라고 요청한 것이 아니라 AI가 일하는 방식 자체를 설계해 속도를 끌어올린 사례다.

bkit과 9일의 개발 기록

bkamp.ai는 Next.js(웹 프레임워크) 기반의 포털과 11개의 마이크로서비스(작은 단위로 쪼개진 서비스들)로 구성되었다. 인프라는 AWS EKS(쿠버네티스 관리 서비스)와 GitOps(깃을 통한 운영 자동화), ArgoCD(배포 자동화 도구), Terraform(코드 기반 인프라 설정 도구)를 사용해 구축했다. 개발자는 첫 커밋에 코드를 넣는 대신 약 150줄 분량의 .claude/CLAUDE.md 파일을 만들어 규칙을 먼저 정의했다.

이 규칙에는 PDCA(계획-실행-점검-조치) 사이클과 한국어 기획 및 영어 코드 작성 원칙, 그리고 사람이 모든 결과를 검증한다는 절차가 포함되었다. 이후 개발자는 이 시스템을 자동화하기 위해 bkit이라는 Claude Code 플러그인을 개발했다. bkit은 PDCA 과정을 상태 머신(정해진 상태 사이를 규칙에 따라 이동하는 시스템)으로 구현해 설계와 구현의 일치율이 90% 미만이면 자동으로 수정 루프를 실행한다. 그 결과 4,000개 이상의 테스트에서 실패 0건을 기록했고 200개 이상의 CI(지속적 통합) 검증 규칙을 통과했다.

프롬프트 작성을 넘어선 컨텍스트 엔지니어링

예전에는 AI에게 채팅 기능을 만들어달라고 요청하는 식으로 기능을 중심으로 명령했다. 하지만 이번 방식은 문서 7의 3.2절을 구현하라는 식으로 문서 기반의 작업을 수행했다. 쉽게 말하면 AI에게 막연한 주문을 하는 것이 아니라 아주 상세한 설계도와 매뉴얼을 주고 그대로 렌더링하게 만든 것이다. 비유하자면 프리랜서에게 말로 설명하는 대신 완벽한 청사진과 체크리스트를 제공해 오차 없이 결과물을 뽑아내는 것과 같다.

이러한 접근법을 컨텍스트 엔지니어링(AI가 일하는 환경과 맥락을 설계하는 기술)이라고 부른다. AI를 단순히 코드를 쓰는 작성자로 보는 것이 아니라 정해진 규칙과 문서를 결과물로 변환하는 엔진으로 활용하는 방식이다. 개발자는 하루 단위로 PDCA 사이클을 반복하며 컨텍스트를 최신 상태로 유지했고 4일 차에는 롤백 가능한 체크포인트를 생성해 프론트엔드 구조를 과감하게 전면 재구성하기도 했다. 인프라 설정은 모든 구조가 정렬된 8일 차에 Terraform과 Kubernetes(컨테이너 관리 도구)를 통해 한 번에 연결했다.

개발자가 바로 체감하는 변화는 AI의 출력 변동성이 거의 사라졌다는 점이다. 기능 중심의 요청은 AI의 해석에 따라 결과가 달라지지만 문서 중심의 요청은 결정적인 결과물을 만들어낸다. bkit은 이러한 워크플로우를 시스템화하여 사람이 일일이 규칙을 기억하고 문서를 맞추는 수고를 덜어준다. 이제 개발자는 코드를 직접 짜는 시간보다 설계 문서를 만들고 검증 규칙을 세우는 상위 단계의 작업에 더 많은 시간을 쏟게 된다.

이제 AI의 성능보다 AI를 가두어 일하게 만드는 시스템의 정교함이 개발 속도를 결정한다.