최근 Claude의 무료, Pro, Max 플랜 사용자들 사이에서 피크 시간대 응답 속도 저하와 서비스 불안정 현상이 빈번하게 관찰되었다. 급격한 사용자 증가로 인해 기존 인프라가 한계치에 도달하며 실제 서비스 품질에 영향을 준 상황이다.
5GW 전력 확보와 1000억 달러 규모의 인프라 계약
Anthropic은 Amazon과 최대 5GW(기가와트, 전력 단위)의 컴퓨팅 용량을 확보하는 신규 계약을 체결했다. 향후 10년간 AWS(Amazon의 클라우드 컴퓨팅 플랫폼) 기술에 1000억 달러 이상을 투입하며, 여기에는 Graviton(Amazon의 범용 ARM 기반 프로세서)과 Trainium2(Amazon의 AI 학습 전용 칩)부터 Trainium4까지의 칩셋 도입이 포함된다. 구체적인 일정으로는 올해 2분기에 상당 규모의 Trainium2 용량이 투입되며, 올해 하반기에는 Trainium3 용량이 본격적으로 가동될 예정이다. 2026년 말까지는 Trainium2와 Trainium3를 합쳐 총 1GW의 용량을 확보하는 것이 목표다.
자본 투자 규모도 확대되었다. Amazon은 이번에 50억 달러를 Anthropic에 즉시 투자하며, 향후 최대 200억 달러를 추가로 투자할 수 있는 옵션을 가졌다. 이는 기존에 진행된 80억 달러 투자에 더해진 수치다. 현재 Anthropic의 Run-rate revenue(현재 매출 추세를 연간으로 환산한 수치)는 300억 달러를 넘어섰다. 2025년 말 기준 약 90억 달러였던 것과 비교하면 3배 이상 급증한 수치다. 현재 10만 명 이상의 고객이 Amazon Bedrock(클라우드 기반 AI 모델 배포 서비스)에서 Claude를 운용하고 있으며, 100만 개 이상의 Trainium2 칩이 모델 학습과 서비스에 투입되고 있다.
Bedrock 호출 방식에서 플랫폼 직접 통합으로의 전환
기존에는 기업들이 Amazon Bedrock(클라우드 기반 AI 모델 배포 서비스)이라는 중간 인터페이스를 통해 Claude 모델을 호출해 사용했다. 반면 앞으로 도입될 Claude Platform on AWS는 별도의 계정 생성이나 계약 없이 AWS 계정 내에서 동일한 제어 권한과 빌링 시스템으로 Claude의 모든 기능을 직접 사용할 수 있게 한다. 거버넌스와 컴플라이언스(기업의 법적 준수 사항) 요구사항을 충족해야 하는 기업 입장에서 관리 포인트가 줄어드는 구조다.
주목할 점은 Claude가 전 세계 3대 클라우드 플랫폼 모두에서 제공되는 유일한 프런티어 모델이라는 지위다. AWS의 Bedrock뿐만 아니라 Google의 Vertex AI(기업용 AI 플랫폼), Microsoft Azure의 Foundry(AI 모델 개발 및 배포 환경) 모두에서 서비스되고 있다. 이번 협력으로 아시아와 유럽 지역의 추론 용량이 확장되어 국제 고객 대응 속도가 개선될 전망이다. 또한 Anthropic Labs의 신제품인 Claude Design(시각적 디자인과 프로토타입을 만드는 도구)을 통해 슬라이드, 원페이지 보고서 등 시각적 작업물 제작 기능이 추가되었다.
상세 내용은 Anthropic on AWS에서 확인할 수 있다.
인프라 확보 전쟁은 이제 모델의 지능을 넘어 전력과 칩이라는 물리적 자원 점유율 싸움으로 완전히 전환되었다.




