매일 아침 개발자들은 AI가 작성한 코드를 검토하며 시간을 보낸다. 최근 커뮤니티에서는 단순히 코드를 빠르게 짜는 도구를 넘어, 기업 환경에서 안전하게 배포까지 책임질 수 있는 시스템에 대한 갈증이 커지고 있다. 이번 주 IBM이 공개한 Bob(AI 기반 소프트웨어 개발 플랫폼)은 이러한 현장의 고민을 정면으로 겨냥했다. 2025년 여름 100명의 내부 사용자로 시작했던 이 도구는 현재 8만 명 이상의 IBM 직원이 사용 중이며, 이제 일반 기업 시장으로 그 범위를 넓혔다. 개발자들 사이에서는 AI 에이전트가 코드를 작성하는 것을 넘어, 실제 운영 환경에서 어떻게 통제 가능한 상태를 유지할 것인가가 뜨거운 논쟁거리다.
IBM Bob의 기능과 가격 체계
IBM은 Bob을 통해 개발 생명주기 전반에 걸쳐 코드를 작성하고 테스트하는 구조화된 환경을 제공한다. 지원하는 모델은 IBM의 Granite(IBM이 개발한 기업용 언어 모델 시리즈), Anthropic의 Claude, 그리고 Mistral(프랑스 AI 기업의 언어 모델) 등이다. Bob은 사용자가 작업을 수행할 때마다 Bobcoin(사용량 기반의 내부 결제 단위)을 차감하는 방식을 채택했다. 1 Bobcoin은 0.50달러로 고정되어 있으며, 코드 생성이나 파일 작업 등 구체적인 액션에 따라 코인이 소모된다. 구독 플랜은 다음과 같이 구성된다.
- 30일 무료 체험: 40 Bobcoins 제공
- Pro 플랜: 월 20달러, 40 Bobcoins 제공
- Pro+ 플랜: 월 60달러, 160 Bobcoins 제공
- Ultra 플랜: 월 200달러, 500 Bobcoins 제공
모든 플랜은 Model Context Protocol(AI 모델이 외부 데이터와 안전하게 통신하도록 돕는 표준) 통합과 Bob Shell(지능형 명령줄 인터페이스) 기능을 포함한다.
제어와 자율성의 균형
예전에는 Cursor(AI 기반 코드 에디터)나 Claude Code(터미널 기반 AI 코딩 도구)처럼 사용자가 직접 프롬프트를 입력하고 단계를 엮어 나가는 방식이 주를 이뤘다. 하지만 이제는 시스템이 개발 과정을 미리 구조화하고, 중간중간 인간의 승인을 요구하는 체크포인트 방식이 기업용 솔루션의 새로운 표준으로 떠오르고 있다. LangGraph(에이전트의 흐름을 정의하는 도구)가 팀 단위의 워크플로우를 정의하는 데 집중한다면, Bob은 개발 생명주기를 역할 기반의 단계로 나누어 AI가 독단적으로 판단하지 않도록 설계했다. 이는 Nvidia의 NemoClaw(자율 에이전트를 샌드박스 환경에서 안전하게 실행하는 도구)나 Kilo Claw(에이전트 보안을 위한 도구)가 추구하는 샌드박스 보안 전략과 궤를 같이한다.
인간 중심의 개발 워크플로우
개발자가 바로 체감하는 변화는 AI의 자율성보다 시스템의 예측 가능성이다. IBM은 Bob을 통해 특정 팀에서 주당 평균 10시간, 즉 선택된 작업에서 최대 70%의 시간을 절약했다고 밝혔다. 이는 단순히 모델의 성능을 높이는 것이 아니라, 인간이 루프 안에 머물며 AI의 결과물을 검증하는 구조를 강제했기에 가능한 결과다. 기업들은 이제 무조건적인 자동화보다는, 감사(Audit)가 가능하고 실수를 사전에 차단할 수 있는 시스템을 선호한다. IBM은 이를 위해 에이전트가 작업을 완료하지 못하거나 오류가 발생할 경우, 사후 처리가 아닌 실시간 체크포인트를 통해 인간의 개입을 유도하는 방식을 택했다.
기업용 AI의 다음 단계는 모델의 파워가 아닌, 자율성과 통제 사이의 정교한 설계에서 결정된다.




