매일 아침 개발 환경을 열고 Claude Code(터미널에서 직접 코드를 수정하고 실행하는 AI 도구)를 실행할 때, 생각보다 빠르게 소진되는 API 비용이나 할당량 때문에 당황한 경험이 있을 것이다. 단순히 질문을 많이 해서가 아니라, AI가 대화의 맥락을 유지하기 위해 과거의 대화 내용, 읽어 들인 파일, 도구 실행 결과 등을 매번 다시 읽어 들이는 과정에서 토큰(AI가 처리하는 데이터 단위)이 눈덩이처럼 불어나기 때문이다.

모델 선택과 명령어 활용

Claude Code는 작업의 난이도에 따라 모델을 유연하게 선택하는 것만으로도 비용을 크게 절감할 수 있다. Anthropic이 제공하는 모델 중 Opus는 Sonnet보다 토큰당 비용이 5배 높으므로, 복잡한 분석이나 리팩토링이 필요한 경우가 아니라면 기본적으로 Sonnet을 사용하는 것이 경제적이다. 단순한 반복 작업에는 Haiku를 활용하고, 작업의 강도를 조절하는 /effort명령어를 통해 모델이 고민하는 깊이를 제한하면 출력 토큰을 직접적으로 줄일 수 있다.

CLAUDE.md 관리와 컨텍스트 최적화

예전에는 프로젝트마다 규칙을 매번 다시 입력해야 했지만, 이제는 CLAUDE.md(프로젝트의 규칙과 제약 사항을 담은 설정 파일)를 활용해 이를 해결한다. 이 파일은 대화가 시작될 때 가장 먼저 읽히며 세션 내내 유지되는데, 5,000토큰 분량의 파일을 작성하면 대화가 이어질 때마다 매번 5,000토큰이 소모된다는 점을 기억해야 한다. 따라서 이곳에는 테스트 실행 방식, 패키지 관리자 설정, 코드 스타일 등 변하지 않는 핵심 규칙만 간결하게 담아야 한다. 회의록이나 긴 가이드를 무작정 붙여넣는 것은 토큰 낭비의 주범이다.

서브 에이전트와 작업 방식의 변화

예전에는 모든 작업을 하나의 대화창에서 처리하려 했다면, 이제는 서브 에이전트(독립적인 컨텍스트를 가진 보조 AI 인스턴스)를 적절히 활용해야 한다. 서브 에이전트는 파일 검색이나 로그 분석 같은 복잡한 과정을 별도의 공간에서 수행하고 결과만 메인 대화창으로 가져오기 때문에 메인 스레드를 깔끔하게 유지할 수 있다. 다만, 아주 간단한 쉘 명령어 실행에는 오히려 서브 에이전트 생성 비용이 더 클 수 있으므로, 작업의 복잡도가 높을 때만 선택적으로 사용하는 것이 효율적이다.

또한, 모호한 질문 대신 구체적인 파일 경로와 범위를 지정하는 습관이 중요하다. 예를 들어 단순히 코드의 문제를 묻기보다 특정 파일의 특정 라인을 비교해달라고 요청하면 AI가 불필요한 파일을 탐색하며 토큰을 낭비하는 일을 막을 수 있다. 작업 실행 전 Shift+Tab을 눌러 진입하는 계획 모드(Plan mode)를 활용하면, 실제 코드를 수정하기 전에 단계를 검토하고 불필요한 시행착오를 사전에 제거할 수 있다.

세션 정리와 컨텍스트 진단

개발자가 바로 체감하는 변화는 세션을 정리하는 시점에 따라 나타난다. Claude Code는 /compact명령어로 대화 내용을 요약할 수 있는데, 이미 컨텍스트 경고가 뜨거나 AI가 기억을 잃기 시작한 뒤에 실행하면 요약의 질이 떨어진다. 세션이 건강할 때 미리 요약하여 불필요한 노이즈를 걷어내야 이후 대화에서 토큰 낭비를 막을 수 있다. 마지막으로, 무엇이 토큰을 잡아먹는지 궁금하다면 /context명령어를 입력해 현재 로드된 파일과 도구 출력값을 직접 확인해 보라. 막연한 추측으로 최적화하기보다, 실제로 컨텍스트를 차지하고 있는 주범을 찾아내는 것이 비용 절감의 가장 빠른 길이다.

효율적인 개발은 AI에게 더 많은 일을 시키는 것이 아니라, AI가 불필요한 과거의 잔상을 기억하지 않도록 환경을 정돈하는 것에서 시작된다.