발표에서 확인된 핵심 사실

월 9억 2천만 달러라는 임대료는 단일 계약으로는 이례적인 규모다. 구글은 스페이스X 데이터센터의 엔비디아 GPU 약 11만 개와 CPU, 메모리를 사용하기 위해 이 금액을 지불한다. 계약 기간은 올해 10월부터 2029년 6월까지 총 32개월이다. 2026년 9월 30일까지 약속된 GPU 접근 제공에 실패할 경우 구글은 계약을 즉시 종료하거나 수수료를 감액할 수 있다.

101억 달러에 달하는 스페이스X의 1분기 자본지출 중 77억 달러가 AI에 투입됐다. AI 사업부는 같은 분기 8억 1,800만 달러의 매출을 냈으나 영업손실은 25억 달러를 기록했다. 상장을 앞둔 스페이스X는 인덱스 제공업체의 수익성 요건을 면제받고 상장 후 인덱스 편입 대기 기간을 90일에서 5일로 단축하며 자금 조달 규칙을 바꾸고 있다.

구글, 아마존, 마이크로소프트, 메타 등 빅테크 4사의 올해 AI 인프라 지출 목표액은 약 1조 달러다. 마이크로소프트는 이미지와 전사, 추론, 음성, 코딩 등 특정 모달리티를 위한 AI 모델 7종을 발표했다. 코파일럿(Copilot, AI 비서)이 이 모델들을 관리하는 오케스트레이션 엔진 역할을 수행한다. 하지만 코파일럿은 구형 모델 기반이라는 지적과 함께 챗GPT(ChatGPT)나 클로드(Claude)보다 경쟁력이 뒤처진다는 평가를 받는다.

메타의 리얼리티 랩스(Reality Labs, VR/AR 사업부)는 지난 분기 매출 4,200만 달러에 영업손실 40억 달러를 냈다. 마이크로소프트가 공개한 AI 데스크톱과 키 카드 형태의 기기 2종은 실제 출하 계획이 없는 컨셉 모델이다. 브로드컴(Broadcom, 반도체 설계 기업)은 전체 메가와트 규모 확장에도 불구하고 메가와트당 지출액이 정체되며 마진이 하락할 가능성이 있다.

기존 방식과 달라진 지점

노트북 한 대로 무거운 AI 모델을 돌리며 서버 비용을 아끼려는 개인 사용자의 환경이 바뀐다. 엔비디아가 첫 프로슈머용 독립 CPU인 RTX Spark를 발표했다. 20개의 CPU 코어와 6,000개 이상의 통합 GPU 코어를 탑재했다. 최대 128GB의 통합 메모리를 지원한다. 가을까지 Asus, Dell, HP, Lenovo, Microsoft의 윈도우 PC와 노트북을 통해 출시될 예정이다.

마이크로소프트는 엔비디아 최신 칩을 탑재해 로컬 모델 실행이 가능한 'Microsoft Surface AI engineered laptop'을 선보였다. 마이크로소프트는 최근 제품에 Claude(클로드, 앤스로픽의 AI 모델)를 포함한 다양한 유형의 모델을 사용하기 시작했다. OpenAI(오픈AI)와의 파트너십 의존도를 낮추고 관계를 일부 단절하며 멀티모달 운영 체제로 전환하려는 시도다.

단순 답변을 넘어 작업 계획, 도구 호출, 코드 실행, 데이터베이스 쿼리, API 사용 등 복잡한 워크플로우를 처리하는 에이전틱 AI(Agentic AI, 자율적 작업 수행 AI) 전용 CPU인 Vera(베라)가 출시됐다. Vera는 파일 확인, 출력 테스트, 실패 단계 재시도 등 에이전트가 지속적으로 작업을 수행하는 부하를 처리하도록 설계된 고성능·고효율 CPU다. Vera CPU와 Rubin(루빈) GPU 아키텍처를 결합한 Vera Rubin 칩은 이미 양산 단계에 진입했다. 에이전트 AI를 하이퍼 스케일로 실행하는 데 중점을 둔 이 칩은 OpenAI와 Anthropic(앤스로픽)에 첫 유닛이 인도됐다.

기술이 실제로 작동하는 방식

투자 시장의 규모가 과거의 상식을 넘어선다. SpaceX, OpenAI, Anthropic가 몇 주 간격으로 S1(증권신고서) 서류를 제출하며 기업공개를 준비한다. 늦어도 올해 4분기까지 완료하는 것이 목표다. 세 회사의 예상 조달 금액은 총 1,800억 달러에 달한다. 이는 닷컴 버블 당시 3년간 조달된 총액인 1,640억 달러보다 많은 수치다.

기업의 확장 방식은 인프라와 모델의 수직 통합으로 흐른다. SpaceX는 600억 달러에 Cursor(AI 코드 편집기)를 인수하는 계약을 체결했다. xAI의 Colossus 2(슈퍼컴퓨터)를 사용해 차세대 코딩 모델을 처음부터 학습시켜 지능을 확장한다. 컴퓨팅 인프라 용량을 배분하고 수익화하며 CoreWeave, Nebius 같은 neoclouds(AI 특화 클라우드)와 경쟁한다.

하드웨어 효율은 구체적인 수치로 증명된다. 엔비디아는 Computex에서 최신 칩의 칩당 메모리 사용량을 10~20% 줄였다고 발표했다. Cosmos 3(물리 AI 모델)는 20조 개의 토큰으로 구성된 멀티모달 데이터셋으로 학습했다. 비디오, 이미지, 로봇 행동 시퀀스를 통해 물리적 세계의 인과관계를 이해한다. Vera(AI 프로세서) CPU는 기존 x86 프로세서보다 에이전트 워크로드 처리 속도가 최대 1.8배 빠르다. 이 칩은 독립형 Vera 서버와 NVIDIA Vera Rubin 시스템, Vera Bluefield 4 STX AI 스토리지 플랫폼에 적용된다.

시장의 반응 속도는 자동화된 봇에 의해 결정된다. 브로드컴 CEO가 2026년 2분기 매출 260억 달러를 2025년 2분기 실적인 150억 달러로 잘못 읽었다. 실시간 모니터링 봇들이 즉각 반응해 주가가 15% 급락했다. 단순한 읽기 실수로 약 1,500억 달러의 기업 가치가 증발했다.

로봇 학습 데이터 병목을 겨냥한 해법

수개월이 걸리던 훈련 주기가 며칠 단위로 압축된다. 엔비디아가 물리적 AI를 위한 오픈 월드 파운데이션 모델 Cosmos 3를 공개했다. 시각, 추론, 월드 생성, 행동 예측을 하나의 시스템으로 결합했다. 물리적 환경을 시뮬레이션해 다음 상태를 예측하며 로봇을 학습시킨다. 실제 환경의 하드웨어 파손 위험과 느린 속도를 합성 데이터로 해결했다.

인간이 아닌 AI가 다음 세대 모델을 학습시키는 단계로 진입한다. 안드레이 카파시가 앤스로픽(Anthropic)의 사전 학습 팀에 합류했다. 단순 자문이 아니라 클로드(Claude)의 핵심 능력을 결정하는 대규모 학습 실행을 담당한다. 워크로드의 중심은 챗봇에서 에이전트로 이동하고 있다. 에이전트의 도구 호출 실행에는 GPU보다 강력한 CPU가 더 적합하다. 엔비디아는 에이전트가 데이터 센터부터 엣지까지 모든 곳에서 구동될 것으로 전망했다.

비용 효율성과 로컬 실행 능력이 새로운 경쟁 지표가 됐다. 알리바바가 클로드 오푸스(Claude Opus)보다 약 6배 저렴한 Qwen 3.7 Max를 공개했다. 이 모델은 생소한 AI 칩을 사용해 35시간 만에 제조사 공식 버전보다 10배 성능이 좋은 컴퓨팅 커널을 스스로 구축했다. 엔비디아는 RTX Spark로 애플의 M 시리즈 칩과 정면 승부한다. 로컬 AI 모델 실행 시장에서 윈도우 진영의 'M1 모먼트'를 만드는 것이 목표다.

하드웨어는 이제 개인화된 에이전트의 물리적 접점이 된다. 마이크로소프트는 사용자의 행동과 말, 글을 실시간으로 섭취해 모델을 개선하는 하드웨어를 구상한다. 구글과 스페이스X의 관계는 5년 만에 완전히 역전됐다. 과거 구글은 스타링크(Starlink) 위성 서비스를 위해 스페이스X에 컴퓨팅 자원을 제공했다. 현재 구글은 스페이스X의 AI 컴퓨팅 용량을 임대해 사용하는 고객이 됐다.

성능과 판단력이 개선된 Claude Opus 4.8을 출시했다

코드 결함을 놓칠 확률이 이전 버전보다 4배 낮아졌다. Anthropic이 출시한 Claude Opus 4.8은 Opus 4.7과 GPT 5.5보다 높은 벤치마크 점수를 기록했다. 2.5배 빠르고 3배 저렴한 'fast mode'를 지원한다. `/effort` 명령어로 사고 수준을 Low, High, XI, Max 단계로 조절할 수 있다. 수백 개의 병렬 서브 에이전트를 실행하고 스스로 검증하는 동적 워크플로우도 도입했다.

입력 토큰 100만 개당 0.5달러, 출력 토큰 100만 개당 2.5달러의 가격표가 붙었다. AI 코드 편집 도구인 Cursor가 출시한 Composer 2.5의 가격이다. Claude Opus 4.7 수준의 성능을 내면서 가격은 1/10 수준으로 낮췄다. 이전 버전보다 25배 많은 합성 태스크로 학습했다.

데이터 센터와 GPU 구축 비용이 예상치를 상회하며 기업들의 가용 현금 흐름이 고갈됐다. AI 인프라 구축 비용(CapEx) 급증으로 공모 자금 조달이 불가피해졌다. Google Cloud는 10월 출시한 대기업용 구독 상품인 Gemini Enterprise의 수요에 대응하기 위해 '브릿지 용량(bridge capacity)'을 확보했다. 마이크론(Micron)은 장기 마진이 66% 하락할 것이라는 보고서 영향으로 주가가 약 6% 하락하며 600억 달러의 가치가 손실됐다.

'업무용 웨어러블(wearables for work)' 기기를 통해 소비자 에이전트 구독을 유도하는 전략이 추진된다. Meta가 계획 중인 AI 펜던트 테스트의 목적이다. 작년 말 AI 펜 스타트업 Limitless 인수와 연계된 행보다. DNA 서열 스크리닝 분야에서는 프런티어 모델(Frontier models, 고성능 AI 모델)의 추론 능력을 활용해 의도적인 탐지 회피를 감지하는 방식이 제안됐다.

구글은 제미나이 엔터프라이즈 수요를 맞추기 위해 스페이스X의 GPU 11만 개를 월 9억 2천만 달러에 임대한다. 자체 인프라 완공 전까지 공백을 메우는 브릿지 캐파 확보 구조다. 빅테크의 인프라 조달 비용 규모는 네오클라우드(Neoclouds)의 시장 영향력을 증명하는 실질적 지표가 됐다. AI 경쟁력은 이제 모델의 성능이 아니라 자본으로 확보한 컴퓨팅 파워의 절대량에서 결정된다.