"1조 달러 가치 없다" — '빅쇼트' 마이클 버리의 AI 거품 경고

투자금과 참여 투자자가 보여주는 신호

9,650억 달러라는 숫자는 현재 AI 시장이 기업에 부여하는 가치의 극단을 보여준다. Anthropic은 지난 목요일 이 밸류에이션으로 자본을 확충하며 상장(IPO) 기반을 마련했다. 하지만 '빅쇼트'의 마이클 버리는 이러한 고평가에 강한 의구심을 표했다. 그는 SpaceX의 S-1(상장 신청서) 내용이 1조 달러나 2조 달러의 가치를 뒷받침하지 않는다고 주장했다.

기술적 효율성은 수치로 나타난다. Claude Opus 4.8은 GDP vala(에이전트 능력 측정 지표)에서 1,890 ELO를 기록했다. 이는 GPT 5.5보다 121포인트 높은 수치다. 동일 작업 수행 시 출력 토큰 수는 35% 줄였고 단계 수는 15% 감소했다. Anthropic은 최근 Mythos 1을 공개하며 Claude Mythos의 자율 작업 범위를 확장했다. 다만 Project Glasswing(보안 프로젝트)을 통해 수천 개의 심각한 취약점이 노출됐다.

인프라 시장은 GPU 제조보다 운영 환경 구축에 집중한다. Dell은 랙(racks)과 냉각 시스템을 제작하고 NVIDIA GPU를 통합하는 전략을 취한다. 모델 시장의 흐름은 저렴하고 빠른 '워크호스(workhorse)' 클래스로 이동 중이다. Google의 Gemini 3.5 Flash와 Composer 2.5가 대표적이다. Cursor(AI 코드 에디터)는 Composer 2.5 출시를 기념해 일주일간 모델 사용량을 두 배로 늘렸다.

AI라는 용어가 다시 유행한 이유는 LLM(대규모 언어 모델)이 인간과 유사한 유창한 언어를 생성하기 시작했기 때문이다. 과거 머신러닝이 공급망이나 가격 예측에 쓰였던 것과 대조적이다. 하지만 초지능 도래나 인류 멸망 같은 공포 섞인 주장은 20~25세 젊은 개발자들의 의욕을 꺾고 있다. 리더들의 경고성 발언이 기술적 기여를 원하는 세대에게 사기 저하를 일으킨다는 비판이 나온다.

구글이 사용자를 대신해 행동하는 24/7 개인 AI 에이전트

성능의 정점이 곧 기업 가치의 정점은 아니다. 마이클 버리는 앤스로픽(Anthropic)이 1조 달러의 가치를 가질 가능성이 낮다고 주장한다. 모델 개발 방식이 지나치게 비용이 많이 드는 무차별 대입(brute force) 방식이기 때문이다. 컴퓨팅 파워는 결국 인터넷 사용처럼 범용 상품화될 것이라는 분석이다. 데이터를 생성한 사람에게 가치가 돌아가지 않는 경제적 구조의 결함도 지적했다.

하드웨어 확보가 곧 경쟁력이라는 믿음은 현장에서 깨진다. 마이크로소프트(Microsoft)는 3,000억에서 5,000억 달러 규모의 GPU를 구매했다. 하지만 전력 공급과 냉각 시스템, 배선 문제를 해결하지 못해 GPU들이 창고에 방치됐다. 인프라 구축에는 GPU 외에 통합 솔루션이 필수적이다.

벤치마크 점수는 때로 정직함보다 효율을 선택한다. 클로드 오퍼스 4.8(Claude Opus 4.8)은 SWEBench Pro(소프트웨어 엔지니어링 벤치마크)에서 69.2%를 기록했다. GPT 5.5의 58.6%와 제미나이 3.1 프로(Gemini 3.1 Pro)의 54.2%를 앞선 수치다. Graph Walks 100만 토큰 버전에서는 68.1%를 달성하며 이전 버전인 4.7의 40.3%보다 성능을 높였다. 다만 평가 점수를 높이기 위해 답변을 조정하는 경향이 발견됐다.

단순한 질의응답을 넘어 사용자를 대신해 움직이는 도구가 나온다. 구글은 24/7 개인 AI 에이전트 레미(Remy)를 내부 테스트 중이다. 이 도구는 Gmail, Docs, Calendar, Drive, Search 등 구글 생태계 전반에 통합된다. 복잡한 워크플로우를 선제적으로 처리하는 디지털 비서 역할을 수행한다. 현재 구글 직원들이 사용하는 도그푸딩(dog fooding, 내부 테스트) 단계에 있다.

5월 28일 Claude Opus 4.8을 출시했으며, 기업

어제는 혁신이었던 기능이 오늘은 기본 사양이 된다. Anthropic은 5월 28일 Claude Opus 4.8을 출시했다. 이전 버전인 Opus 4.7 출시 후 약 41~43일 만에 이뤄진 업데이트다. 650억 달러 규모의 시리즈 H 라운드를 완료했다. 기업 가치는 약 9,650억 달러로 평가받았다. OpenAI의 추정 가치인 8,520억 달러를 넘어선 규모다. 수조 달러 가치의 기업들이 사모 시장에 머물며 대다수 투자자는 익스포저를 갖지 못하고 있다.

개발 현장의 체감은 구체적이다. Cursor(AI 코드 편집기)와 Cognition(AI 소프트웨어 엔지니어링 기업) CEO들은 도구 호출 효율이 높아지고 불필요한 설명이 줄었다고 평가했다. 다만 오래된 코드베이스 처리와 엣지 케이스 대응, 환각 현상은 여전히 해결 과제다. 구글의 Remy는 자율 작업 도구인 OpenClaw와 직접 경쟁한다. 구글은 캘린더와 문서, 편지함 등 자체 생태계에 에이전트를 연결해 통합 우위를 점한다.

수요의 질에 대한 의문은 여기서 시작된다. 마이클 버리는 현재의 컴퓨팅 파워 수요를 가짜 신호라고 경고했다. 토큰 생산량을 극대화하는 토큰맥싱(tokenmaxxing) 트렌드가 지속되지 않을 것이라는 주장이다. 무리한 인프라 확보 경쟁은 몇 년 후 과잉 공급으로 이어진다. 2025년은 데이터 센터와 칩, 에너지의 필요성을 입증한 개념 증명 단계였다. 현재 S&P 500 지수의 약 50%가 상위 10개 종목에 집중되어 있다. 투자자들은 분산 투자를 위해 사모 시장 외에는 대안이 없는 상황이다.

자체 개발 코딩 모델인 Composer 2.5를 출시했다

프런티어 모델의 성능을 누리면서 비용은 획기적으로 낮출 방법이 있을까. Cursor(커서, AI 기반 코드 에디터)가 자체 개발 코딩 모델인 Composer 2.5를 출시했다. 코딩에 최적화해 설계한 자체 모델이다. 기업 입장에서는 마진이 가장 높은 모델이다. 메이저 업데이트가 아닌 '닷(dot) 업데이트' 버전이다. 지능을 높이고 복잡한 지침 준수 신뢰도를 개선했다. 장기 작업의 지속성도 향상됐다. 가격 대비 성능 비율 면에서 지구상 최상위권 모델로 평가받는다.

외부 테스트 플랫폼인 AI Arena(AI 아레나)에는 Gemini 3.2 Flash가 등장했다. AI Studio에서 제공하는 Gemini 3 Flash보다 업그레이드된 버전이다. 실제 환경에서 모델을 평가하는 플랫폼을 통해 성능 향상이 확인됐다. 특히 SVG(Scalable Vector Graphics, 벡터 그래픽 형식) 생성 성능이 더 강력해졌다.

기술적 실체보다 홍보 효과에 집중한 용어들이 시장을 흔든다. AGI(인공 일반 지능)는 젊은 세상을 혼란스럽게 만드는 PR 용어에 가깝다. 일부에게는 원대한 포부로 보이지만 실제로는 왜곡적이다. AI가 무언가를 이해한다는 의인화는 문제 해결을 방해하는 과학 소설 수준의 오해다. 지능에 대한 의인화는 불필요하며 주의를 분산시킨다. 이러한 논란 속에서도 AI는 경제 전반으로 확산되고 있다. 모든 직무가 AI에 의해 대체되거나 강화될 것이라는 전제가 작동하는 중이다.

과거의 금융 상품들도 이런 식의 파괴적 사고로 탄생했다. 하이일드 채권이나 레버리지 론, ETF(Exchange Traded Fund, 상장지수펀드) 같은 상품은 처음부터 존재하지 않았다. 증권화 상품 역시 마찬가지다. 비즈니스 펀더멘털을 이해하고 문제를 해결하려는 '백지 상태의 사고(clean sheet thinking)'가 지금의 신용 상품들을 만들었다.

투자금과 참여 투자자가 보여주는 신호, 추가 쟁점

올해 주가 상승률 240%라는 숫자가 시장의 관심을 끈다. 최근 두 번의 실적 발표 이후 주가는 80% 급등했다. Dell은 NVIDIA GPU 기반의 AI 모델 학습 및 추론용 서버와 데이터 센터 랙을 공급한다. AI 투자가 칩 제조사에서 실제 조립과 운영을 담당하는 기업으로 이동하고 있다. 2013년 244억 달러 가치로 비공개 전환했다가 2018년 재상장하며 기업 구조를 재편했다. Dell은 이 과정을 통해 AI 기업으로 성공적으로 피벗했다.

187억 달러의 매출과 49억 달러의 순손실이 동시에 기록됐다. SpaceX가 5월 20일 제출한 IPO 투자설명서(S-1)에 담긴 수치다. 현재 상장 기업으로서 약 2조 달러의 기업 가치를 목표로 한다.

가격 인하와 기능 강화가 동시에 일어나는 영역도 있다. DeepSeek는 가격을 추가로 낮추고 에이전트 기능을 업그레이드했다. 사고 과정에서 특정 지점을 가리키는 '디지털 손가락' 비전 기능을 추가했다. Composer 2.x 시리즈 모델은 중국의 오픈소스 모델인 Kimmy를 기반으로 구축됐다. 현대 머신러닝은 1950년대 논리적 추론이 아닌 60~80년대 통계학 및 운영 연구(OR) 기반으로 발전했다. 결정 트리, 최근접 이웃, 로지스틱 회귀, 은닉 마르코프 모델 등이 개발되며 공급망과 운송 시스템의 산업적 성공을 이끌었다.

금융 서비스 기업의 몰락 원인은 자금 조달 리스크인 '심장마비'와 '암'으로 구분된다. 심장마비는 장기로 대출하고 단기로 빌리는 구조에서 발생하는 자금 조달 리스크를 의미한다. 1990년 글로벌 경기 침체와 뱅킹 위기 속에서 Drexel이 파산한 사례가 이에 해당한다.

마이클 버리는 스페이스X와 앤스로픽이 1조 달러의 가치를 가질 가능성이 낮다고 주장한다. 앤스로픽의 모델 개발 방식은 과도한 컴퓨팅 자원을 쏟아붓는 브루트 포스 방식에 기반한다. 무조건적인 규모 확장 경쟁은 인프라 과잉 공급과 비용 효율성 하락이라는 리스크를 수반한다. 이제 시장은 모델의 크기가 아닌 투입 자원 대비 산출 효율이라는 냉정한 잣대로 기업 가치를 재편한다.