Gemini 3.5 Flash가 나왔다 — 구글은 모델보다 하네스를 같이 밀었다
구글 I/O에서 가장 중요한 신호는 단순히 새 모델 이름 하나가 추가됐다는 점이 아니다. 코드팩토리 자막 기준으로, 구글은 Gemini 3.5 Flash와 Antigravity 2.0을 함께 전면에 세웠다. 여기에 Antigravity CLI와 Antigravity SDK까지 공개되면서, 이번 발표는 모델 성능 업데이트와 개발 워크플로 업데이트가 한 덩어리로 묶인 행사에 가까웠다.
Gemini 3.5 Flash의 핵심은 속도와 안정성이다. 자막에서는 Gemini 3 Flash가 빠르기는 했지만 환각 문제가 심해 사용자가 제대로 방향을 잡아주지 않으면 문제가 많이 생기는 모델이었다고 짚는다. 반면 3.5 Flash는 그 성능 문제를 상당 부분 해결했고, 일부 영역에서는 Gemini 3.1 Pro보다 더 나은 성능을 보인다고 설명한다. 더 중요한 지점은 속도다. 3.1 Pro보다 압도적으로 빠르다는 평가가 붙으면서, 구글이 다시 “빠른 실사용 모델” 카테고리를 강하게 밀고 있다는 점이 드러난다.
다만 구글은 모델 자체만으로 모든 문제를 해결하려 하지 않았다. Antigravity 2.0은 UI가 Codex나 Claude 앱과 비슷한 방향으로 정리됐고, 제한된 기간 동안 3.5 Flash High와 Medium을 빠른 모드로 쓸 수 있게 했다. 여기서 흥미로운 점은 환각 문제를 모델 내부에서만 줄이는 것이 아니라, 한 단계 위의 개발 하네스가 모델을 감독하고 지시하는 구조로 접근한다는 점이다. 자막의 evidence card도 Antigravity를 “Gemini 3.5 Flash의 환각을 줄이는 상위 감독 레이어”로 해석한다.
CLI와 SDK 공개는 이 흐름을 더 분명하게 만든다. Antigravity CLI는 터미널에서 엔진을 직접 다룰 수 있게 하고, SDK는 실제 서비스 코드베이스에 Antigravity를 통합할 수 있게 한다. 결국 구글의 메시지는 “새 모델을 내놨다”에서 끝나지 않는다. 빠른 모델, 그 모델을 관리하는 하네스, 그리고 개발자가 서비스 안으로 끌어들일 수 있는 인터페이스까지 한 번에 내놓은 것이다. Gemini 3.5 Flash의 출시는 모델 경쟁인 동시에, AI 개발 환경 전체를 장악하려는 구글의 선언에 가깝다.
Gemini Omni는 영상계의 나노 바나나인가 — 실사용은 가능성과 한계를 동시에 보였다
두 번째로 눈에 띄는 축은 Gemini Omni다. 코드팩토리는 “영상계의 나노 바나나”라는 표현으로 이 모델을 테스트했다. 자막을 보면 발표 영상처럼 한 번에 원하는 결과가 나오는 마법 같은 도구라기보다는, 영상 속 인물과 사물을 분석한 뒤 장면을 거의 새로 재구성하는 모델에 가깝다. 이 점이 장점이면서 동시에 현재 한계다.
실제 테스트에서는 손가락을 튕기는 순간 사무실 배경을 애니메이션 풍경으로 바꾸라는 요청이 들어갔다. 결과는 흥미로웠지만 완벽하지 않았다. 배경은 바뀌었지만 원래 회사의 배치가 유지되지 않았고, 원본에 없던 의자나 사물이 등장했다. 사용자가 “물건은 그대로 두라”고 명시하고 Flow에서 참고 이미지까지 넣어도, 모델은 원래 장면을 보존하기보다 인물과 대략적인 아이템을 파악한 뒤 새 장면을 만들어내는 쪽에 가까웠다.
이 때문에 Gemini Omni의 현재 가치는 “정확한 영상 편집 도구”보다는 “강한 재구성형 영상 생성 도구”에 있다. 프로모션에서 보이는 것처럼 딸깍 한 번으로 원하는 결과가 바로 나오는 수준은 아직 아니며, 여러 번 반복해 결과를 다듬는 과정이 필요하다. 자막에서도 몇 차례 이터레이션을 거치면 충분히 보완할 수 있지만, 구글의 새 서비스가 많이 나온 직후라 서버 처리 속도가 느려 여러 번 돌려보기 어려웠다고 설명한다.
그래도 활용 가능성은 분명하다. 특히 UGC 광고처럼 빠르게 시안을 만들고, 인플루언서 촬영이나 계약 없이 여러 버전의 영상을 실험해야 하는 영역에서는 유용할 수 있다. Gemini Omni는 아직 장면 보존과 공간 일관성에서 약점을 보이지만, 영상의 분위기와 구성을 과감하게 바꾸는 능력은 이미 충분히 강하다. 이번 소식의 핵심은 구글이 텍스트와 코드 모델을 넘어, 영상 생성과 편집의 실사용 영역까지 Gemini 브랜드를 확장하고 있다는 점이다.
우주 데이터 센터가 온다 — 발사 비용이 96% 폭락했다
SpaceX가 우주를 정부의 전유물에서 상업적 공공 서비스(utility)로 바꾸고 있다. 그 중심에는 매년 50%씩 성장하는 스타링크가 있다. T-모바일, 버라이즌, AT&T 같은 글로벌 통신사들과 손잡고 연결망을 확장하는 전략이다. 기반이 되는 발사 서비스의 경쟁력도 압도적이다. 지난해에만 팰컨 9(Falcon 9)을 165회 쏘아 올렸으며, 2025년 발사 서비스 매출은 45억 달러에 달할 전망이다. 우주가 더 이상 미지의 영역이 아닌, 돈이 되는 시장이 됐다.
이런 지배력의 핵심은 우주로 물건을 보내는 비용을 획기적으로 낮춘 데 있다. 반복을 통해 더 싸고 빠르게 일을 처리하는 '학습률(learning rate)' 원리를 적용한 결과다. 킬로그램(kg)당 운송 비용은 초기 4만 달러 수준에서 현재 약 1,600달러까지 떨어졌다. 비용 장벽이 무너지자 기업들이 우주에 대규모 하드웨어와 인프라를 구축할 길이 열렸다. 가격 파괴가 곧 진입 장벽의 붕괴다.
효율성이 극대화되면 결국 우주 데이터 센터가 등장한다. 지상 데이터 센터와 경쟁하려면 kg당 비용이 200달러 수준까지 내려가야 한다. 구글의 분석에 따르면, SpaceX의 현재 효율 개선 속도를 고려할 때 2030년대 중반이면 이 수치에 도달한다. 임계점을 넘어서는 순간 우주로 쏘아 올리는 장비의 양은 폭발적으로 늘어날 것이다. 전 세계 데이터 처리 인프라의 중심축이 지상에서 우주 궤도로 이동하는 시점이다. 데이터 센터의 미래는 땅 위가 아니라 궤도 위에 있다.
내 취향을 AI에게 직접 말한다 — 스포티파이가 추천 방식을 바꾸는 법
스포티파이가 음악 추천 방식을 완전히 바꾼다. 그동안 추천 알고리즘은 내부 작동 원리를 알 수 없는 '블랙박스' 같았지만, 이제는 사용자가 직접 조종할 수 있는 시스템으로 전환한다. 핵심은 '취향 프로필(taste profile)' 기능이다. 사용자는 스포티파이가 자신에 대해 어떤 데이터를 가지고 있는지 투명하게 확인하고, 어떤 정보를 남기고 지울지 직접 결정할 수 있다. 더 나아가 채팅으로 "특정 아티스트 곡을 더 추천해 줘"라고 요청하거나 마음에 들지 않는 곡을 거절하며 AI의 추천 방향을 실시간으로 가이드할 수 있다. 이제 추천은 AI의 일방적 통보가 아니라 사용자와의 대화가 된다.
이를 위해 스포티파이는 검색, 팟캐스트, 홈 화면마다 따로 운영하던 파편화된 모델들을 거대언어모델(LLM) 기반의 단일 통합 체계로 합쳤다. AI 파운데이션 팀은 Llama나 Qwen 같은 공개 가중치 모델을 가져와 '지속적 사전 학습(continual pre-training)'과 '지도 미세 조정(supervised fine-tuning)' 과정을 거쳤다. AI가 이미 가진 일반적인 지식에 스포티파이 내부의 플랫폼 지식을 심어, AI가 왜 이 곡을 추천했는지 설명하고 사용자의 의도를 더 정확히 반영하게 만든 것이다. 또한 방대한 음악 카탈로그를 효율적으로 처리하기 위해 '의미론적 ID(semantic IDs)' 기술을 도입했다. 복잡한 곡 정보를 AI가 문장 속 단어처럼 쉽게 처리할 수 있도록 짧은 토큰 형태로 압축한 방식이다.
문제는 7억 5천만 명이 넘는 사용자 모두를 위해 개별 모델을 학습시키는 것은 불가능하다는 점이다. 스포티파이는 사용자의 고유한 특성을 수학적 수치인 '벡터(vector)'로 변환해 AI의 작업 공간에 직접 투입하는 방식으로 이 문제를 해결했다. 이를 통해 프롬프트(prompt)에 사용자가 누구인지 실시간으로 알려주는 유연한 정보 조각인 '소프트 토큰(soft token)'을 삽입한다. 이 소프트 토큰을 사용자의 최근 활동 기록 및 현재 요청 맥락과 결합하면, AI는 개개인의 취향을 정확히 반영하면서도 상황에 맞는 초개인화된 추천을 내놓을 수 있다. 개별 학습 없이도 AI가 나를 기억하게 만든 셈이다.
개발자는 환호해도 투자자는 실망한다 — 구글의 전략이 엇갈린다
구글은 지금 'AI 전쟁의 승리'를 정의하는 기준을 두고 심각한 내홍을 겪고 있다. 시장의 기대치와 현장 개발자의 요구 사항이 완전히 엇갈리고 있기 때문이다. 자칫하면 실제 사용자는 만족시키고도, 돈줄을 쥔 투자자들에게는 외면받는 최악의 시나리오가 현실이 될 수 있다.
월스트리트 투자자들의 계산법은 단순하다. 경쟁사를 압도하는 '압도적 성능의 모델' 하나면 충분하다. 이들이 기다리는 것은 GPT 5.5나 Opus 4.7 같은 파괴적인 혁신이다. 투자자들에게 버전 숫자의 상승은 곧 시장 지배력의 증거다. 정작 모델이 세상에서 제대로 돌아가게 만드는 복잡한 기반 시설에는 관심이 없다.
반면 실제 소프트웨어를 만드는 개발자들의 시선은 다르다. 화려한 버전 숫자보다 중요한 것은 '검증 장치(engineering harness)'다. 자율형 AI(AI agents)를 실제로 구현하고 관리하는 데 필요한 도구와 체계를 뜻한다. 개발자에게는 모델의 지능이 소폭 상승하는 것보다, AI를 안정적으로 배포하고 통제하는 능력이 훨씬 절실하다. 결국 모델을 실제 제품으로 빠르게 바꿀 수 있는 신뢰도 높은 시스템이 핵심이다.
여기서 구글의 치명적인 소통 리스크가 발생한다. 구글이 개발 환경을 개선하고 도구를 정교하게 다듬어도, 시장은 그 가치를 알아채지 못할 가능성이 크다. 투자자들은 검증 장치의 미세한 성능 향상보다는 GPT 5.5 같은 자극적인 헤드라인에 반응하기 때문이다. 개발자 생태계에서 거둔 전략적 승리가 금융 시장에서는 '혁신 부재'라는 실패로 오독될 수 있는 상황이다.
스포티파이, 음악과 팟캐스트를 하나의 수학 지도로 통합한다
스포티파이는 사용자와 콘텐츠를 동일한 수학적 공간에 배치해 추천의 정확도를 높이고 있습니다. 기존에는 음악, 팟캐스트, 사용자 정보를 각각 별도의 범재로 분류했지만, 이제는 이 모든 요소를 하나의 '임베딩 공간(embedding space)'에 통합하는 교차 콘텐츠 모델링을 도입했습니다. 이 시스템은 노래, 아티스트, 팟캐스트 에피소드, 그리고 사용자 각각에 고유한 숫자 형태의 좌표인 벡터를 부여합니다. 이를 통해 사람과 콘텐츠 사이의 관계를 일관된 기준으로 파악합니다. 예를 들어, 기술 뉴스를 즐겨 듣는 엔지니어의 사용자 벡터는 관련 기술 팟캐스트의 벡터와 매우 가까운 위치에 놓이게 되며, AI는 이를 통해 사용자의 관심사를 즉각적으로 이해합니다.
이러한 전략은 사용자의 활동을 압축된 데이터로만 추적하던 기존의 방식에서 벗어나, 거대언어모델(LLM)을 활용하는 방향으로의 전환을 의미합니다. 스포티파이는 이 수학적 지도와 거대언어모델 사이의 간극을 좁히기 위해 '의미론적 식별자(semantic IDs)'를 사용합니다. 구글 연구 논문에서 처음 소개된 이 개념은 방대한 콘텐츠 목록을 압축해 거대언어모델이 라이브러리 내 항목들의 성격을 쉽게 파악하도록 돕는 역할을 합니다. 복잡한 데이터를 AI가 이해하기 쉬운 식별자로 변환함으로써, 스포티파이는 인공지능에게 음악과 팟캐스트의 구조적 의미를 명확히 전달합니다.
개인화 추천의 완성도를 높이기 위해 스포티파이는 사용자 벡터와 '소프트 토큰화(soft tokenization)' 과정을 결합한 체계를 활용합니다. 이 기술은 사용자의 고유한 벡터를 거대언어모델이 이해할 수 있는 언어 단위인 토큰 공간으로 투영합니다. 즉, 사용자의 취향과 정체성을 AI가 읽는 질문(프롬프트) 안에 직접 삽입하는 방식입니다. 덕분에 모델은 추천을 생성할 때 사용자가 누구인지에 대한 맥락을 즉시 파악합니다. 내부 지표에 따르면 사용자 벡터, 의미론적 식별자, 벡터 투영을 결합한 이 방식은 매우 정교한 개인화 결과를 도출하며, 공유된 수학적 공간 안에서 각 사용자에게 최적화된 콘텐츠를 정확히 찾아냅니다.
오픈AI, 애플에 소송 검토 — 계약 위반 주장하며 갈등 격화
오픈AI가 애플을 상대로 법적 대응을 검토 중이다. 애플 생태계에 챗GPT를 결합하는 과정에서 계약을 위반했다는 것이 핵심 이유다. 양사는 애플 인텔리전스(Apple Intelligence)를 통해 수억 명의 사용자에게 고도화된 AI 기능을 제공하겠다는 야심 찬 협력을 약속했으나, 실제 구현 방식에서 오픈AI가 계약상 의무가 지켜지지 않았다고 판단하면서 파트너십이 법적 분쟁으로 치닫고 있다.
이번 갈등의 씨앗은 WWDC 2024에서 발표된 도입 방식부터 뿌려졌다. 협력 초기부터 양사의 관계는 미묘한 거리감이 느껴졌다. 샘 올트먼 오픈AI CEO가 행사에 참석했음에도 공식 발표 무대에는 오르지 않았는데, 이는 양사 간의 전략적 방향이 일치하지 않았음을 보여주는 대목이었다. 오픈AI는 애플이 챗GPT를 핵심 기능이 아닌 부가적인 요소로 취급했다고 보고 있다. 애플 인텔리전스가 챗GPT를 소프트웨어의 중심에 녹여내는 대신, 시리(Siri)가 처리하기 어려운 복잡한 요청을 단순히 챗GPT로 넘기는 '우회로'로 활용했기 때문이다.
이처럼 핵심 기술이냐, 아니면 보조 도구냐를 둘러싼 시각 차이가 분쟁의 본질이다. 오픈AI는 애플이 기술을 주변부 기능으로 치부함으로써 당초 합의한 계약 조건을 이행하지 않았다고 주장한다. 이번 법적 긴장은 AI 개발사와 하드웨어 거물 사이의 균열을 여실히 드러낸다. 오픈AI는 자사 기술이 시리의 보조 수단이 아닌, 사용자 경험을 이끄는 핵심 동력으로 자리 잡기를 원한다. 이번 분쟁의 결과는 향후 거대 기술 기업들이 AI를 자사 제품에 통합할 때 어떤 방식으로 협력하고 계약을 이행할지, 그 기준점을 다시 쓰는 계기가 될 것으로 보인다.
로봇 운영체제 공개한 RL World, 제조사 벽 허문다
산업 자동화 시장이 서로 다른 브랜드의 로봇이 소통하고 협력할 수 있는 공통 표준을 향해 움직이고 있습니다. RL World는 최근 자사의 휴머노이드 로봇 시스템인 RLDX1의 모델 가중치(model weights)를 공개했습니다. 이는 인공지능이 정보를 처리하고 동작을 수행하게 만드는 핵심 데이터 패턴입니다. 이 가중치를 깃허브(GitHub)나 허깅페이스(Hugging Face) 같은 공개 플랫폼에 배포함으로써, 누구나 사용할 수 있는 휴머노이드 로봇용 운영체제를 구축하려는 시도입니다. 현대 인터넷의 근간이 된 오픈소스 소프트웨어 리눅스(Linux)처럼, 전 세계 자동화 인력을 위한 공통 기반을 만들겠다는 전략입니다.
이러한 행보는 폐쇄적인 기술 정책을 고수하는 현재 업계 흐름과 극명하게 대비됩니다. 테슬라(Tesla)의 옵티머스(Optimus)나 피규어(Figure)의 Figure 03 같은 주요 경쟁사들은 자사 모델을 철저히 비공개로 유지하고 있습니다. RL World는 RLDX1을 오픈소스로 전환해 전 세계 개발자들이 소프트웨어를 함께 개선할 수 있는 환경을 만들었습니다. 이는 로봇이 상업적으로 활용 가능한 수준에 도달하는 시간을 앞당길 핵심 동력이 될 것입니다. 제조사별로 고립된 로봇 생태계를 넘어, 서로 다른 로봇이 하나의 목표를 위해 협업하는 시스템을 지향합니다.
실제 RLDX1 시스템은 이미 완전한 자율 행동을 보여주고 있습니다. 다만 현재 로봇의 움직임 속도는 사람보다 다소 느린 편입니다. 최근 시연된 협업 사례를 보면, 한 로봇이 물건을 건네면 다른 로봇이 이를 받아 상자에 담는 동작이 가능합니다. 아직 고속 상업 현장에 투입하기엔 속도가 부족하지만, 오픈소스 프로젝트 특유의 빠른 개선 과정을 거치면 머지않아 인간의 작업 능력을 뛰어넘을 것으로 보입니다. 기업 입장에서는 특정 제조사의 생태계에 갇히지 않고, 유연한 범용 지능을 갖춘 로봇 노동력을 확보하는 미래가 열리고 있습니다.
모질라, 클로드 3 Mythos로 1년 치 버그를 한 달 만에 해결했다
모질라(Mozilla)가 소프트웨어 오류를 수정하는 속도를 비약적으로 높이며, 인공지능이 어떻게 기존의 느리고 지루한 버그 수정 과정을 완전히 탈바꿈시킬 수 있는지 증명했다. 모질라는 자체 업무 흐름(workflow)에 특화된 AI 도구를 도입해, 사람이 직접 작업했다면 1년 넘게 걸렸을 분량의 소프트웨어 문제를 단 몇 주 만에 해결했다. 이는 소프트웨어 안정성을 유지하는 방식이 기존의 느린 점진적 개선에서, 결함이 머무는 시간을 획기적으로 줄이는 신속하고 대규모적인 정비 체계로 근본적인 변화를 맞이했음을 의미한다.
이러한 생산성 폭발의 기폭제는 클로드 3 Mythos의 도입이었다. 모질라는 단 한 달 만에 이 도구를 활용해 총 423개의 버그를 찾아내고 수정했다. 이 성과가 얼마나 압도적인지 이해하려면 지난 15개월간 모질라가 발견해 고친 전체 버그 수와 비교해보면 된다. 이번 한 달 동안 해결한 버그 수가 지난 15개월간의 총합을 넘어섰기 때문이다. 결국 AI가 1년 이상의 유지보수 업무를 단 30일로 압축해, 소프트웨어 내부에 오랫동안 쌓여있던 방대한 오류 더미를 단숨에 걷어낸 셈이다.
이 정도의 효율성은 소프트웨어 품질 보증(QA)의 새로운 시대를 예고한다. 이제 AI는 개발자를 보조하는 수준을 넘어, 문제 발견의 속도 자체를 완전히 바꿔놓고 있다. 일반 사용자 입장에서는 치명적인 결함이 널리 퍼지기 전에 빠르게 수정되므로, 훨씬 안정적이고 안전한 제품을 더 빨리 만날 수 있게 된다. 모질라 개발자들에게도 클로드 3 Mythos의 활용은 일상의 변화를 가져왔다. 이들은 숨겨진 오류를 찾는 지루한 반복 작업에서 벗어나, 소프트웨어의 구조를 개선하는 더 높은 차원의 업무에 집중할 수 있게 됐다. 423개라는 수정 건수는 AI가 인간 팀 단독으로는 불가능했던 규모의 소프트웨어 감사를 수행할 수 있다는 강력한 증거다.
구글, 개인용 AI와 기업용 AI 두 마리 토끼를 다 잡는다
구글은 AI 시장에서 어느 한쪽을 선택하는 대신, 가능한 모든 사용자를 끌어안는 전략을 택했습니다. 애플과 메타가 일반 소비자 시장에 집중하고, 앤스로픽이 전문적인 업무 환경을 공략하는 등 다른 거대 기술 기업들이 특정 분야로 방향을 트는 것과 대조적입니다. 구글은 이 두 시장을 동시에 공략하며 오픈AI와 함께 일상적인 개인 업무 도구부터 기업 생산성을 위한 고성능 소프트웨어까지 모두 장악하려는 드문 행보를 보이고 있습니다.
이처럼 넓은 영역을 유지하기 위해 구글은 단순히 글자를 주고받는 수준을 넘어 기술적 역량을 확장하고 있습니다. 텍스트, 이미지, 소리 등 서로 다른 정보를 동시에 처리하고 연결하는 심층 다중 모달 시스템(deep multimodal systems)과 차세대 영상 생성 기술, 그리고 세상을 이해하는 '세계 모델(world models)'까지 개발 중입니다. 하지만 이러한 공격적인 확장 전략은 '제품 난립'이라는 숙제를 안겨주었습니다. 모든 분야에서 1등을 하려다 보니 도구들 간의 기능이 겹치면서, 사용자가 무엇을 써야 할지 혼란스러운 파편화된 생태계가 만들어질 위험이 있습니다.
구글은 소프트웨어 시장을 넘어 AI 운영의 물리적·에너지적 한계를 극복하기 위해 우주까지 눈을 돌리고 있습니다. 구글은 2030년대 중반이 되면 지구보다 우주에 데이터 센터와 이를 뒷받침할 발전소를 짓는 것이 더 저렴해질 것으로 내다봅니다. 이러한 장기적인 야망은 궤도 진입 비용의 하락과 직결됩니다. 이미 우주 발사 비용은 킬로그램당 4만 달러에서 4천 달러 수준까지 급격히 떨어졌습니다. 구글은 이 비용이 특정 임계점에 도달하면 우주 기반 인프라가 주는 막대한 이점이 수요 폭발을 일으키고, 컴퓨팅의 물리적 기반 자체가 지구를 벗어나게 될 것이라고 확신합니다.
스페이스X 기업공개 목표액 2조 달러, 텍사스 법이 방패 된다
스페이스X와 테슬라가 경영진을 향한 주주 소송의 변동성으로부터 보호하기 위해 텍사스주의 법적 보호망을 전략적으로 활용하고 있다. 핵심은 주주가 경영진의 잘못을 지적하며 회사를 대신해 제기하는 ‘주주 대표 소송’을 까다롭게 만드는 텍사스 법을 도입하는 것이다. 델라웨어주와 달리 텍사스는 지분 3% 이상을 보유해야만 소송을 제기할 수 있도록 문턱을 높였다. 이 규정은 소액 주주들이 기업 지배구조를 흔드는 소송을 남발하는 것을 원천 차단해 경영진의 법적 리스크를 효과적으로 줄여준다.
이러한 법적 환경 변화는 경영진에 대한 거액의 보상을 복구하는 발판이 됐다. 2025년 관련 개혁안이 통과된 이후, 델라웨어주 대법원은 기존의 맥코믹 판결을 뒤집으며 일론 머스크의 560억 달러 규모 보상안을 되살렸다. 당시 소송 과정에서 변호사들만 막대한 이익을 챙기고 정작 주주들은 손해를 입었다는 비판이 뒤따랐다. 법원이 이전 판결을 번복하면서 경영진의 주식 기반 보상이 다시 확보됐고, 결과적으로 머스크는 과거 박탈당했던 거액의 보상을 온전히 되찾게 됐다.
머스크가 이끄는 기업들의 재무적 목표는 더욱 공격적으로 확장되고 있다. 테슬라는 이미 이전보다 더 크고 대담한 새로운 보상안을 마련해 주주들의 75% 찬성을 이끌어냈다. 이 보상안의 목표를 달성하기 위해 머스크는 테슬라의 기업 가치를 8조 5천억 달러까지 끌어올려야 하는 과제를 안게 됐다. 이는 스페이스X가 추진 중인 2조 달러 규모의 기업공개(IPO)와 궤를 같이하는 야심 찬 수치다. 텍사스의 우호적인 법적 환경과 거액의 보상안 복구는 이들 기업이 역사상 전례 없는 기업 가치를 향해 나아가는 데 필요한 구조적 안전장치 역할을 하고 있다.
AI가 기억력을 되찾자 연산 부담이 8천 배로 폭증했다
차세대 거대 AI 모델을 훈련하는 과정은 이제 메모리 한계와의 싸움이 되었습니다. 특히 모델이 자신의 내부 추론 과정을 다시 들여다보게 만드는 '주의 잔차(attention residuals)' 기술을 도입하면서부터입니다. 이 방식은 모델이 정보를 처리하는 경로를 완전히 바꿉니다. 일반적인 모델은 문장의 단어를 왼쪽에서 오른쪽으로 훑으며 중요한 부분에 집중하는 '주의(attention)' 메커니즘을 사용하지만, 주의 잔차는 이 과정을 네트워크의 깊이 방향으로 수직 적용합니다. 덕분에 모델은 데이터를 층층이 통과시키며 반복적으로 압축하는 과정에서 중요한 정보를 잃지 않고, 자신의 연산 이력에서 필요한 데이터를 선택적으로 다시 불러올 수 있습니다.
문제는 이 '되돌아보기' 능력이 '제곱 비례 연산(quadratic scaling)'이라는 거대한 수학적 부담을 초래한다는 점입니다. 기존 구조에서는 층과 층 사이에서 데이터를 압축한 상태값 하나만 넘기면 그만입니다. 하지만 주의 잔차를 쓰면 모델은 이전 모든 층의 상태를 메모리에 살려둬야 합니다. 128개 층을 가진 모델이라면 시스템은 매 단계마다 128개의 벡터를 유지하고 그 전체를 대상으로 주의 연산을 수행해야 합니다. 데이터가 마지막 층에 도달할 때쯤이면 약 8,000번의 주의 연산이 발생하며, 필요한 연산량이 폭발적으로 늘어납니다.
이러한 요구 사항은 메모리 압박과 통신 과부하를 일으키며, 특히 여러 프로세서에 데이터를 동기화해야 하는 대규모 분산 훈련 환경에서 치명적입니다. 연구진은 주의 잔차를 Kim et al.의 선형 구조에 통합하면서 이러한 효율성 문제를 해결해야 했습니다. 하드웨어에 가해지는 부담은 상당하지만, 그럼에도 이 기술은 훈련 성능 지표와 확장 법칙(scaling laws)에서 일관된 향상을 보여주며 그 가치를 증명했습니다. 이제 남은 과제는 모델이 자신의 이력을 스스로 찾아내는 지능적 향상과, 이를 훈련하는 하드웨어의 물리적 한계 사이에서 균형을 잡는 일입니다.




