금요일 오후, 개발팀의 공유 채널.

에이전트에게 복잡한 작업을 맡겨둔 개발자가 수천 개의 토큰이 낭비된 로그를 보며 한숨을 내쉰다. 의도가 조금만 어긋나도 에이전트는 엉뚱한 방향으로 루프를 돌며 비용과 시간을 소모하기 때문이다.

이런 비효율적인 리소스 낭비를 막기 위해, 에이전트가 수행할 목표를 정교하게 설계해 주는 도구가 등장했다.

Goal Setter의 인터뷰 기반 목표 설정과 설치 방식

개발자가 Codex(AI 코드 생성 도구)의 Goal 기능을 사용할 때 가장 먼저 마주하는 문제는 의도의 미세한 어긋남이 막대한 토큰 낭비와 시간 손실로 이어진다는 점이다. Goal Setter는 이러한 비효율을 줄이기 위해 사용자와의 인터뷰를 통해 정밀한 목표 파일을 생성하는 방식을 제안한다. 인터뷰 과정에서는 작업의 정확한 완료 상태와 절대 수행해서는 안 될 금지 사항을 명확히 정의하는 단계가 포함된다. 특히 성공 여부를 객관적으로 판단할 수 있는 증거(evidence)를 설정하고 작업이 막혔을 때 어느 시점에서 멈추어 보고해야 하는지를 구체적으로 확인하는 과정이 핵심이다. 이러한 인터뷰 항목들은 OpenAI가 발표한 사용 팁을 기반으로 설계되었으며 Codex의 skill-creator(스킬 생성 도구) 스킬을 활용해 구축되었다. 이는 단순한 프롬프트 입력을 넘어 에이전트가 수행해야 할 작업의 경계선을 명확히 긋는 작업으로 관찰된다.

인터뷰가 완료되면 결과물은 프로젝트 루트의 goals/ 디렉토리에 마크다운(.md) 파일 형태로 저장된다. 사용자는 생성된 문서의 내용을 검토하고 요구사항이 충분히 반영되지 않았을 경우 에이전트에게 수정을 요구하며 완성도를 높이는 반복 리뷰 과정을 거친다. Goal 기능은 특성상 장시간 많은 토큰을 소모하며 실행되기에 초기 프롬프트를 정교하게 다듬는 것이 전체 비용 절감에 결정적인 영향을 미친다. 이렇게 정제된 목표 파일은 `/goal @goals/*.md` 명령어를 통해 즉시 실행에 옮겨진다. 특히 목표 설정 내용이 파일로 기록되기 때문에 Git(분산 버전 관리 시스템)에 추가하여 내역을 관리할 수 있다는 점이 실무적 이점으로 분석된다. 이는 팀 단위 협업 시 에이전트의 작업 지침을 코드와 동일한 생명주기로 관리할 수 있음을 의미한다.

해당 도구의 설치는 Codex 환경 내에서 skill-installer(스킬 설치 도구) 스킬을 사용하여 수행한다. 설치를 위해서는 다음과 같은 명령어를 입력하여 관련 스킬셋을 환경에 이식한다.

bash
Use $skill-installer to install https://github.com/computerphilosopher/agent-skills/…

이 과정은 개별 프롬프트를 매번 수동으로 입력하는 번거로움을 없애고 검증된 스킬셋을 즉각적으로 적용하는 구조를 가진다. GitHub 저장소에서 제공되는 스킬들을 통해 개발자는 목표 설정의 정밀도를 높이고 에이전트의 자율 수행 능력을 제어할 수 있는 기술적 기반을 마련하게 된다. 결과적으로 Goal Setter는 AI가 스스로 목표를 해석하는 과정에서 발생할 수 있는 불확실성을 최소화하고 실행의 예측 가능성을 높이는 도구로 작동한다.

단순 프롬프트 입력과 마크다운 기반 Goal 관리의 차이

기존의 Goal 설정 방식은 채팅창에 즉흥적인 텍스트 명령을 입력하는 수준에 머물렀다. 사용자가 모호하게 지시를 내리면 에이전트는 의도를 잘못 해석한 채 작업을 수행하며, 이는 곧 막대한 토큰 낭비와 시간 손실로 이어진다. 특히 Goal 기능은 장시간에 걸쳐 대량의 토큰을 소비하며 실행되는 특성이 있어, 초기 프롬프트의 작은 오차가 전체 작업의 실패나 비효율적인 리소스 사용으로 직결되는 구조다. 단순 입력 방식에서는 에이전트가 추측으로 빈 공간을 채우기 때문에, 결과물이 사용자의 실제 의도와 괴리될 가능성이 상존하며 이를 수정하기 위해 다시 많은 토큰을 소모해야 하는 악순환이 관찰된다.

Goal Setter(목표 설정 최적화 스킬)는 이러한 즉흥성을 배제하고 인터뷰를 통한 구조화된 파이프라인을 제안한다. 에이전트는 사용자에게 완료 상태의 정의, 금지 사항, 성공 여부를 판단할 증거, 그리고 작업 중단 및 보고 시점이라는 네 가지 핵심 요소를 질문하며 요구사항을 구체화한다. 이 프로세스는 OpenAI(오픈AI)가 발표한 사용 팁을 기반으로 Codex(코드 생성 및 자동화 도구)의 skill-creator 스킬을 통해 구현되었다. 사용자는 인터뷰 과정에서 스스로 인지하지 못했던 제약 조건을 발견하게 되며, 이는 결과적으로 에이전트가 헤매지 않고 최단 경로로 목표에 도달하게 만드는 정교한 설계도가 된다.

인터뷰가 완료되면 정제된 목표는 프로젝트 루트의 `goals/` 디렉토리에 `.md` 파일로 저장된다. 이는 단순한 텍스트 기록을 넘어 목표 설정 과정 자체가 소프트웨어 공학의 버전 관리 체계로 편입됨을 의미한다. 개발자는 Git(분산 버전 관리 시스템)을 통해 Goal 파일의 변경 이력을 추적하고, 팀원과 함께 마크다운 문서를 리뷰하며 최적의 프롬프트를 공동으로 찾아낼 수 있다. 단순 채팅 입력 방식에서는 휘발될 수밖에 없던 지시 사항들이 파일 형태로 자산화됨에 따라, 유사한 작업 수행 시 기존 문서를 재활용하거나 미세 조정하는 효율적인 운영이 가능해진다.

최종 실행 단계에서는 작성된 문서를 직접 호출하여 제어력을 극대화한다. `/goal @goals/.md` 명령어를 통해 검증된 마크다운 파일을 실행함으로써, 실행 시점의 변동성을 최소화하고 일관된 결과를 도출한다. 사용자는 에이전트와 리뷰를 반복하며 문서 내용을 수정하고, 마음에 들 때까지 프롬프트를 다듬는 과정을 거친다. 이러한 반복적 정제 과정은 실제 대규모 토큰을 사용하는 실행 단계 이전에 논리적 결함을 제거하는 필터 역할을 수행하며, 결과적으로 전체 개발 사이클의 예측 가능성을 높이는 실무적 가치를 제공한다.

에이전트 워크플로우의 정밀도 향상과 실무적 가치

개발자가 AI 에이전트에게 장시간 과업을 맡길 때 가장 먼저 마주하는 문제는 의도와 다른 방향으로 흐르는 토큰 소모다. 목표가 모호하면 에이전트는 불필요한 경로를 탐색하며 비용을 낭비하고, 이는 곧 프로젝트의 경제성 하락으로 이어진다. Goal Setter(에이전트의 목표 설정을 돕는 도구)는 사용자와의 인터뷰를 통해 완료 상태, 금지 사항, 성공 판단 근거, 중단 및 보고 시점이라는 네 가지 핵심 요소를 정의한다. 이 인터뷰 프로세스는 OpenAI가 발표한 사용 팁을 기반으로 Codex의 skill-creator(스킬 생성 도구) 스킬을 통해 구현되었다. 특히 성공 여부를 어떤 증거로 판단할지 명시하는 과정은 에이전트가 자의적으로 판단하는 오류를 줄이는 핵심 장치로 작용한다. 이러한 정밀한 목표 설정 과정은 에이전트가 엉뚱한 방향으로 실행되는 리스크를 사전에 차단하며, 결과적으로 장기 실행 시 발생하는 불필요한 토큰 소모를 방지하는 실무적 효과를 낸다.

정의된 목표가 프로젝트 루트의 `goals/` 디렉토리에 `.md` 파일 형태로 저장된다는 점은 협업 관점에서 중요한 가치를 가진다. 기존의 프롬프트 엔지니어링이 개별 개발자의 채팅창 속에 머물렀다면, 이제는 마크다운 문서라는 표준화된 형태로 팀원 간에 공유되고 검토된다. 이는 Git(분산 버전 관리 시스템)을 통한 내역 관리를 가능하게 하여, 에이전트의 제약 조건이 어떻게 변경되었는지 추적하고 코드 리뷰와 유사한 방식으로 프롬프트를 관리하는 프로세스를 구축하게 한다. 팀원들은 생성된 문서를 함께 리뷰하며 요구사항을 수정할 수 있고, 최종 합의된 내용을 바탕으로 `/goal @goals/.md` 명령어를 통해 동일한 기준의 워크플로우를 실행함으로써 개별 실행 결과의 편차를 줄인다.

복잡한 장기 과업을 수행하는 에이전트일수록 실행 시간이 길어짐에 따라 초기 의도에서 벗어나는 의도 이탈 현상이 관찰된다. Goal Setter가 제안하는 정교한 프롬프트 구조는 에이전트가 스스로 현재 상태를 증거 기반으로 판단하게 하여 이러한 이탈 가능성을 낮춘다. 특히 `Use $skill-installer to install https://github.com/computerphilosopher/agent-skills/…` 명령어로 설치 가능한 이 스킬은 OpenAI가 공개한 최적화 기준을 따르고 있어 실무 적용 시의 신뢰도를 높인다. 개발자는 에이전트와 리뷰를 반복하며 목표를 정교화하는 과정을 통해, 단순한 명령 전달이 아닌 정밀한 제어권을 확보하게 된다. 결국 목표 설정의 정밀도는 단순한 편의성을 넘어, AI 에이전트가 실제 프로덕션 환경에서 비용 효율적으로 작동하며 신뢰할 수 있는 결과물을 내놓는지를 결정짓는 핵심 변수가 된다.