1.4x. 앤스로픽의 최신 모델 오푸스 4.7의 가격이 이전 버전보다 1.4배 올랐다. 성능이 좋아지면 가격이 뛰는 최신형 스마트폰 출시 때와 비슷하다. 그런데 이번 가격 인상은 단순한 업데이트가 아니라 AI 기업들이 수익 모델을 구체화했다는 신호다. 그동안 챗GPT 같은 서비스는 수억 명의 사용자를 모았지만, 수익은 월 20달러 수준의 구독료에 묶여 있었다. 인프라 구축에 수조 원을 쏟아붓는 상황에서 소액 구독료로는 비용 감당이 불가능했다. 하지만 코딩 에이전트(AI가 스스로 코드를 짜고 수정하는 도구)가 등장하며 상황이 바뀌었다. 개발자가 하루 종일 AI와 협업하며 엄청난 양의 데이터를 주고받자, 정액제로는 감당할 수 없는 사용량이 발생한 것이다. 이제 기업들은 AI를 단순한 채팅 도구가 아니라 실제 업무를 수행하는 직원처럼 쓰기 시작했다. 이에 OpenAI와 앤스로픽은 기업용 요금제를 쓴 만큼 내는 API 토큰 방식으로 빠르게 전환하며 수익 회수에 나섰다.
기업용 요금제가 API 토큰 기반 종량제로 전환됐다
정액제 서비스의 낮은 비용은 AI 기업의 손실로 이어진다. 코딩 에이전트를 전문적으로 사용하는 헤비 유저가 ccusage 도구로 한 달 동안 쓴 API 토큰 비용을 계산하면 2,180.16달러에 이른다. 토큰은 AI가 글자를 읽고 쓰는 최소 단위로, 이 양이 많을수록 서버 계산 비용이 늘어난다. 하지만 이 사용자가 앤스로픽의 Max 플랜과 OpenAI의 Pro 플랜을 통해 내는 구독료는 월 200달러 수준에 불과해 실제 비용과 10배 넘는 격차가 발생한다. 사용자가 도구를 많이 쓸수록 기업이 손해를 보는 구조였다.
앤스로픽은 이런 손실을 막기 위해 2025년 11월부터 기업용 요금제 체계를 바꿨다. 과거에는 일반적인 업무 시간 동안 충분히 쓸 수 있는 양을 제공하는 정액제 방식이었다. 지금은 사용자 한 명당 월 20달러의 기본료를 받고, 그 외의 사용량은 API 가격에 맞춰 따로 청구한다. 기본 입장료를 내고 내부에서 이용한 서비스만큼 추가금을 내는 방식으로 전환한 것이다. 기존 고객들은 계약을 갱신하는 시점에 이 변화를 통보받고 비용 상승을 체감하고 있다.
OpenAI 역시 2026년 4월 2일부터 코덱스(Codex, 코드 생성 AI)의 과금 방식을 메시지당 청구에서 API 토큰 사용량 기반으로 변경했다. 단순히 메시지를 몇 번 보냈느냐가 아니라, 그 메시지에 담긴 데이터 양을 따져 돈을 받는 식이다. 이 변화는 플러스와 프로, 비즈니스 요금제뿐 아니라 기업용 플랜 전체에 적용됐다. 4월 23일부터는 교육, 의료, 정부 기관 및 교사용 플랜을 포함한 모든 기존 기업용 계정까지 확대했다. OpenAI는 내부적으로 크레딧이라는 단위를 쓰지만, 실제 계산 방식은 API 토큰 비용과 일치한다. 여기에 4월 23일 출시한 GPT-5.5 API 가격을 이전 모델인 GPT-5.4보다 2배나 올리며 수익성을 높였다.
이런 공격적인 가격 정책은 낮은 유료 전환율과 막대한 인프라 비용 때문이다. OpenAI의 주간 활성 사용자 수는 9억 명에 달하지만, 실제로 돈을 내는 유료 구독자는 5,000만 명으로 전체의 5.6%에 불과하다. 수조 원 단위의 서버 인프라 비용을 감당하려면 소수의 개인 구독자보다 기업의 대량 사용량에서 수익을 내야 한다. 특히 코딩 에이전트처럼 한 번에 수만 개의 토큰을 소비하는 도구가 일상화되면서, 사용량에 비례해 과금하는 종량제가 유일한 생존 전략이 됐다.
코딩 에이전트의 확산이 12.5억 달러의 인프라 비용을 만든다
우버는 2026년 한 해 동안 쓰기로 한 AI 예산을 단 몇 달 만에 모두 써버렸다. 앤스로픽의 코딩 에이전트인 클로드 코드(Claude Code, 개발자가 명령어를 입력해 코드를 짜게 하는 도구)를 도입한 결과다. 지난 분기 우버 개발팀이 제출한 전체 코드의 25%가 이 도구를 통해 작성됐다. 단순한 보조 도구를 넘어 실무의 4분의 1을 책임지는 핵심 인력이 된 셈이다. 코딩 에이전트는 컴퓨터에 명령어를 입력해 수행하는 모든 작업을 자동화할 수 있다. 고액 연봉을 받는 전문 개발자들이 매일 쓰는 도구인 만큼 토큰 소모량은 일반 챗봇과는 비교할 수 없을 정도로 많다. 기업 입장에서 예산 초과라는 상황이 벌어졌지만, 실제 업무 생산성이 올라가면서 비용 지불을 멈출 수 없는 상태가 됐다.
인프라 비용 규모는 상상을 초월한다. 앤스로픽은 컴퓨팅 자원인 콜로서스(COLOSSUS)와 콜로서스 II를 확보하기 위해 스페이스X에 매달 12.5억 달러를 지불하는 계약을 맺었다. 2026년 5월부터 시작된 이 계약은 2029년 5월까지 이어진다. 특히 이 거액의 비용은 모델을 학습시키는 단계가 아니라, 이미 만들어진 모델을 작동시켜 답변을 내놓는 추론 단계에서 발생한다. 전 세계 기업들이 코딩 에이전트를 실무에 투입하면서 서버 부하가 폭증했음을 보여준다. AI 기업들은 이제 단순한 소프트웨어 회사가 아니라, 거대한 전력과 연산 장치를 직접 관리하는 인프라 기업처럼 운영되고 있다. 앤스로픽이 단일 벤더에게만 매달 이 정도 금액을 쓰는 것은 추론 예산이 비대해졌음을 증명한다.
돈을 버는 구조도 바뀌었다. 앤스로픽은 2026년 2분기 매출이 109억 달러에 달하며 처음으로 흑자를 낼 가능성이 크다. 과거에는 월 20달러 수준의 개인 구독료에 의존했지만, 이제는 쓴 만큼 내는 API(응용 프로그램 인터페이스, 소프트웨어 간 통신 규칙) 과금 방식이 주 수입원이 됐다. 중간 유통 단계를 거치지 않고 기업에 직접 도구를 공급하며 수익을 극대화하는 전략이다. 이런 흐름은 채용 시장에서도 나타난다. OpenAI 전체 채용의 32.6%인 229건, 앤스로픽의 26.9%인 105건이 기업 영업 및 지원 인력이다. 2025년 11월 GPT-5.1과 오푸스 4.5가 출시되며 에이전트의 실무 능력이 입증되자, AI 기업들이 개인 사용자보다 기업 고객을 잡는 데 총력을 기울이고 있다.
개발 도구 도입 시 월간 고정 예산보다 토큰 사용량 추이를 우선 확인해야 한다
기업이 실무 비중이 높은 에이전트를 도입할 때는 기존의 정액제 구독료가 아닌 API 토큰 단위의 예상 소비량을 먼저 산출해야 한다. 우버의 사례처럼 정액제 기반의 예산 수립은 실제 사용량을 반영하지 못해 조기 소진될 위험이 크기 때문이다. 개발팀이 작성하는 코드의 양과 그에 따른 토큰 소모 속도를 주 단위로 모니터링하여 예산 초과를 방지하는 내부 관리 체계를 갖춰야 한다. 생산성 향상분이 비용 증가액을 상회하는지 매달 수치로 대조하는 작업이 필요하다.
기업용 플랜 선택 시 모델의 성능과 비용 효율성을 분리해서 판단해야 한다.
OpenAI와 앤스로픽이 기업용 요금제를 토큰 종량제로 전환하면서, 무조건 최신 모델을 쓰는 것이 경제적이지 않은 상황이 되었다. 특정 작업에 GPT-5.5와 같은 고성능 모델이 반드시 필요한지, 아니면 더 저렴한 이전 버전으로도 충분한지 업무별로 등급을 나누는 작업이 필요하다. 모든 업무를 최상위 모델로 처리하면 기업의 운영 비용은 통제 불가능한 수준으로 치솟는다. 모델 성능과 비용의 균형점을 찾아 최적의 조합을 구성해야 운영비를 통제할 수 있다.
서비스 공급사와 계약 시 사용량 기반의 비용 예측 모델을 요구해야 한다.
앤스로픽이 2025년 11월부터 기본료에 추가 사용료를 더하는 방식을 도입한 것처럼, 이제 기업용 AI 계약은 사용량에 따라 비용이 변동되는 구조로 자리 잡았다. 계약 갱신 시점에 과거의 정액제 방식이 유지되는지, 아니면 토큰 과금 체계로 전환되는지 명확히 확인해야 한다. 예상치 못한 비용 폭탄을 피하려면 계약서상에 사용량 상한선 설정이나 비용 알림 서비스가 포함되어 있는지 반드시 챙겨야 한다. AI 인프라 비용의 급격한 상승은 이제 기업이 직접 통제해야 할 운영의 영역이다.




