이번 주 개발자 커뮤니티는 OpenAI의 전 최고 기술 책임자였던 미라 무라티가 세운 Thinking Machines Lab(미라 무라티가 설립한 AI 스타트업)의 행보로 뜨겁다. 베일에 싸여 있던 이 회사가 갑자기 Google Cloud와 수십억 달러 규모의 초대형 계약을 맺었다는 소식이 전해지자, 깃허브와 X(구 트위터)에서는 이들이 대체 무엇을 만들고 있는지에 대한 추측이 쏟아지고 있다. 특히 단순한 클라우드 이용을 넘어 최신 하드웨어 자원을 선점했다는 점에 주목하며, 다음 세대 모델의 등장이 임박했다는 반응이 지배적이다.

Google Cloud와 GB300 기반의 수십억 달러 인프라 확보

이번 계약의 규모는 단일 자릿수 10억 달러 단위로 알려졌다. Thinking Machines Lab은 Google Cloud의 AI 인프라를 확장 사용하며, 특히 Nvidia의 최신 GB300(Nvidia의 최신 AI 가속기 칩) 기반 시스템에 접근 권한을 갖게 되었다. 이 계약에는 모델 훈련과 배포를 지원하는 인프라 서비스가 모두 포함되어 있다.

Google은 현재 스토리지, Kubernetes engine(컨테이너화된 애플리케이션을 자동으로 배포하고 관리하는 시스템), Spanner(Google의 글로벌 분산 데이터베이스 서비스)와 같은 기존 클라우드 서비스와 AI 인프라를 묶어 제공하는 전략을 펼치고 있다. 실제로 이번 달 초 Anthropic(최첨단 AI 모델을 개발하는 선도적인 연구소) 역시 Google 및 Broadcom과 협력해 수 기가와트 규모의 TPU(Tensor Processing Unit, Google이 머신러닝 작업용으로 설계한 맞춤형 AI 칩) 용량을 확보하는 계약을 체결한 바 있다.

Thinking Machines Lab의 배경도 구체적이다. 2025년 2월 설립된 이 회사는 시드 라운드에서 120억 달러의 기업 가치를 인정받으며 20억 달러의 투자금을 유치했다. 지난 10월에는 맞춤형 프런티어 AI 모델 생성을 자동화하는 도구인 Tinker(맞춤형 프런티어 AI 모델 생성을 자동화하는 도구)를 처음으로 출시했다. 이번 계약을 통해 Thinking Machines Lab은 Google Cloud 고객 중 가장 먼저 GB300 기반 시스템을 사용하게 되었으며, Google에 따르면 이는 이전 세대 GPU 대비 훈련 및 서빙 속도가 2배 향상된 수치다.

강화 학습의 비용 문제와 클라우드 진영의 점유율 전쟁

단순히 최신 칩을 쓴다는 점보다 중요한 것은 이들이 무엇을 훈련시키느냐 하는 점이다. Google은 이번 계약을 통해 Thinking Machines Lab의 Reinforcement learning(강화 학습, 시행착오를 통해 최적의 행동 방식을 찾아내는 학습 방법) 워크로드를 지원한다고 밝혔다. Tinker의 아키텍처가 바로 이 강화 학습에 의존하고 있기 때문이다. 강화 학습은 최근 DeepMind와 OpenAI가 거둔 돌파구의 핵심 기술이지만, 연산 비용이 극심하게 높기로 유명하다. 수십억 달러 규모의 계약금은 결국 이 막대한 연산 비용을 감당하기 위한 실질적인 비용이다.

현재 AI 인프라 시장은 거대 모델 개발사들을 선점하려는 클라우드 기업들의 전쟁터다. Anthropic이 Google과 계약하는 동시에 아마존과도 Claude(Anthropic의 대규모 언어 모델) 훈련 및 배포를 위해 최대 5기가와트의 용량을 확보하는 계약을 맺은 것이 대표적인 사례다. Thinking Machines Lab 역시 올해 초 Nvidia로부터 투자를 포함한 파트너십을 맺었지만, 클라우드 서비스 제공업체와 직접 계약한 것은 이번이 처음이다.

비독점 계약 형태이기에 Thinking Machines Lab이 향후 다른 클라우드 제공업체를 추가로 이용할 가능성은 열려 있다. 하지만 Google 입장에서는 빠르게 성장하는 프런티어 랩을 조기에 묶어둠으로써 자사 생태계의 영향력을 확장하려는 계산이 깔려 있다. 결국 하드웨어의 성능 차이가 모델의 학습 속도와 직결되고, 이것이 곧 시장 출시 시점을 결정짓는 상황에서 GB300의 2배 빠른 속도는 단순한 수치 이상의 경쟁 우위를 의미한다.

인프라의 규모가 곧 지능의 한계를 결정하는 시대에, 자본과 칩을 동시에 거머쥔 스타트업의 속도는 기존 빅테크의 예측 범위를 넘어설 것이다.