83.6%.

제미나이 3.5 플래시가 MCP Atlas(멀티모달 역량 평가 지표) 벤치마크에서 기록한 수치다.

경량 모델이 플래그십 모델의 지능을 따라잡으며 속도까지 확보한, 이른바 '가성비의 임계점'을 넘은 결과다.

그런데 구글이 I/O 2026에서 던진 진짜 승부수는 단순한 모델 성능 개선이 아니다.

구글은 이번 발표를 통해 검색의 정의를 다시 썼다. 이제 사용자는 검색창에 키워드를 입력해 결과를 기다리는 것이 아니라, 24시간 작동하는 '정보 에이전트'를 통해 업데이트를 보고받는다. 그 중심에는 에이전트 우선 개발 플랫폼인 구글 안티그래비티(Google Antigravity)가 있다. 모델이 단순히 텍스트를 뱉는 단계를 넘어, 실시간으로 인터랙티브한 UI를 설계하고 실행하는 '액션'의 영역으로 진입한 것이다.

여기에 모든 입력값에서 모든 출력값을 만들어내는 제미나이 옴니(Gemini Omni)의 등장은 멀티모달의 지형을 바꾼다. 물리 법칙을 이해하는 비디오 생성부터 개인화된 AI 검색 모드까지, 구글은 검색 엔진이라는 기존의 정체성을 '개인용 AI OS'로 전환하려는 거대한 포석을 깔았다. 10억 명의 월간 사용자를 확보한 AI 모드의 확장은 이 전략이 단순한 실험이 아님을 증명한다.

제미나이 3.5 플래시와 옴니, 그리고 10억 명의 AI 모드

제미나이 3.5 플래시가 시장에 나왔다. 이 모델은 프런티어급 지능과 실행력을 결합한 최신 시리즈의 첫 제품이다. 구글 AI 스튜디오와 안드로이드 스튜디오, 그리고 에이전트 우선 개발 플랫폼인 구글 안티그라비티(Google Antigravity)를 통해 즉시 사용할 수 있다. 성능은 대형 플래그십 모델과 견줄 수준이다. 터미널 벤치 2.1(Terminal-Bench 2.1)에서 76.2%, GDPval-AA에서 1656 Elo, MCP Atlas에서 83.6%를 기록했다. 이는 제미나이 3.1 프로를 상회하는 수치다. 개발자는 이제 지연 시간과 품질 사이에서 타협할 필요가 없다. 특히 장기적인 에이전트 작업 수행에 최적화되었다. 과거 개발자가 며칠, 감사인이 몇 주를 소비하던 작업을 극히 짧은 시간 내에 완료한다. 비용 또한 다른 프런티어 모델의 절반 이하로 낮췄다. 제미나이 3.5 프로는 다음 달 출시를 앞두고 현재 내부 테스트 중이다.

제미나이 옴니(Gemini Omni)는 모든 입력에서 모든 출력을 생성하는 전방위 멀티모달 모델이다. 비디오 출력을 시작으로 모든 형태의 입출력을 통합하는 구조다. 물리 법칙에 대한 직관적 이해와 역사, 과학, 문화적 지식을 결합했다. 중력, 운동 에너지, 유체 역학 같은 물리적 힘을 정교하게 구현한다. 단순한 실사 구현을 넘어 의미 있는 스토리텔링이 가능하다. 이미지, 텍스트, 비디오, 오디오 등 어떤 참조 자료도 하나의 일관된 결과물로 변환한다. 오디오 입력은 음성 참조부터 시작해 점진적으로 확대한다. 생성된 모든 비디오에는 식별 불가능한 신스아이디(SynthID) 디지털 워터마크가 포함된다. 구글 플로우(Google Flow, 크리에이티브 협업 도구) 사용자들은 옴니 플래시를 통해 실제 영감과 생성 콘텐츠를 결합하고 대화형으로 수정할 수 있다. 장면이 바뀌어도 인물의 정체성과 목소리가 유지되는 캐릭터 일관성 또한 개선되었다.

구글의 AI 모드(AI Mode) 월간 사용자 수는 10억 명을 돌파했다. 구글은 이 거대한 사용자 층의 기본 모델로 제미나이 3.5 플래시를 전 세계에 적용했다. 이는 검색 엔진의 지형을 단순 정보 제공에서 실행형 에이전트로 바꾸는 포석이다. 제미나이 옴니 플래시는 구글 AI 플러스, 프로, 울트라 구독자에게 제공된다. 유튜브 쇼츠 리믹스(YouTube Shorts Remix)와 유튜브 크리에이트(YouTube Create) 앱에서도 18세 이상 사용자라면 무료로 사용할 수 있다. 사용자는 프롬프트 하나로 시네마틱 줌을 적용하거나 배경을 바꿀 수 있다. 카메라 롤의 사진이나 영상을 업로드해 템플릿을 적용하는 과정에 전문 장비나 기술적 용어가 필요 없다. 커스텀 AI 아바타를 통해 자신의 모습과 목소리를 영상에 투영하는 것도 가능하다. 구글은 모델의 지능을 넘어 10억 명의 접점이라는 강력한 배포망을 에이전트 생태계의 하드웨어로 구축했다.

물리 법칙을 이해하는 옴니와 실시간 UI를 짜는 안티그래비티

제미나이 옴니는 픽셀의 배치만 학습한 기존 생성 AI와 궤를 달리한다. 중력과 운동 에너지 그리고 유체 역학 같은 물리 법칙을 모델 내부에서 직접 이해하고 반영한다. 단순한 시각적 모사가 아니라 물리적 세계관을 학습한 결과다. 이미지와 텍스트 그리고 비디오와 오디오라는 서로 다른 양식의 입력을 하나의 응집된 출력물로 변환하는 멀티모달 능력을 갖췄다. 특히 영상 생성 과정에서 삽입되는 SynthID(구글의 디지털 워터마크)는 콘텐츠의 진위 여부를 검증하는 핵심 안전장치로 작동한다. 이는 단순한 영상 제작 도구를 넘어 현실 세계의 인과관계를 시뮬레이션할 수 있는 지능형 엔진으로의 진화를 의미한다. 옴니는 사용자가 제공한 이미지나 오디오 같은 참조물을 기반으로 일관된 정체성을 유지하며 새로운 결과물을 도출하는 구조를 취한다.

사용자 인터페이스의 지형은 구글 안티그래비티(Google Antigravity)라는 에이전트 우선 개발 플랫폼을 통해 재편된다. 기존의 UI가 설계자가 미리 짜놓은 고정된 틀 안에서 움직였다면 이제는 제너레이티브 UI(Generative UI)가 그 자리를 대체한다. 사용자의 질문 의도에 맞춰 인터랙티브 시각 자료와 표 그리고 그래프와 시뮬레이션을 실시간으로 설계하고 조립한다. 정해진 결과 페이지를 보여주는 방식에서 벗어나 질문에 최적화된 인터페이스를 즉석에서 제조하는 구조다. 이는 검색 결과의 단순 나열이 아니라 문제 해결을 위한 최적의 도구를 실시간으로 생성하는 기술적 도약이다. 개발자가 일일이 컴포넌트를 배치하던 방식에서 AI가 목적에 맞는 레이아웃을 스스로 구성하는 방식으로 제어권이 이동한다.

물리 법칙을 이해하는 옴니의 인지 능력과 안티그래비티의 동적 UI 생성 능력은 상호 보완적인 포석이다. 옴니가 복잡한 물리 현상을 계산해내면 안티그래비티는 이를 사용자가 가장 이해하기 쉬운 시각적 형태로 구현한다. 텍스트 기반의 답변을 넘어 실시간으로 작동하는 시뮬레이션 툴이나 맞춤형 대시보드를 구축하는 단계로 진입했다. 입력값의 형태에 구애받지 않는 멀티모달 통합 능력은 이 과정에서 데이터의 병목을 제거한다. 텍스트와 이미지 그리고 비디오가 하나의 맥락으로 묶여 처리되기에 출력물의 응집도가 높아진다. AI가 단순히 정보를 요약하는 수준을 넘어 사용자의 목적에 맞는 소프트웨어를 실시간으로 코딩하고 배포하는 에이전트 환경을 구축하는 원리다. 이는 정적인 웹 페이지의 시대를 끝내고 동적인 서비스 생성의 시대로 진입하는 전환점이 된다.

'품질과 지연시간의 트레이드오프'를 끝낸 3.5 플래시의 성능

개발팀이 공개한 수치는 여기서 갈린다. 제미나이 3.5 플래시는 상위 모델인 제미나이 3.1 프로의 성능을 여러 지표에서 넘어섰다. 특히 코딩과 에이전트 능력을 정밀하게 측정하는 터미널 벤치 2.1(Terminal-Bench 2.1)에서 76.2%의 정답률을 기록했다. 에이전트의 추론 능력을 평가하는 GDPval-AA(에이전트 성능 평가 지표)에서는 1656 Elo를 달성하며 지능적 우위를 증명했다. MCP Atlas(모델 제어 능력 측정 도구)에서도 83.6%라는 높은 수치를 기록했다. 이는 경량 모델이 단순히 보조적인 역할을 수행하던 시대를 지나 플래그십 모델의 지능을 실질적으로 대체하는 지형이 형성되었음을 의미한다.

인공지능 성능 분석 플랫폼인 아티피셜 애널리시스(Artificial Analysis) 인덱스에서의 배치는 더욱 상징적이다. 3.5 플래시는 인덱스의 우측 상단 영역에 안착했다. 이 구역은 최상위 수준의 지능과 압도적인 처리 속도를 동시에 확보한 모델만이 진입할 수 있는 지점이다. 그동안 AI 산업은 모델의 품질을 높이면 지연시간이 늘어나고, 속도를 높이면 지능이 떨어지는 트레이드오프(Trade-off, 상충 관계)의 굴레에 갇혀 있었다. 구글은 3.5 플래시를 통해 이 기술적 제약을 정면으로 돌파했다. 실시간 응답성이 생명인 AI 에이전트 서비스에서 지연시간은 사용자 경험을 결정짓는 핵심 변수다. 고지능 모델을 초고속으로 구동할 수 있게 된 점은 에이전트의 실시간 상호작용 능력을 비약적으로 끌어올린다.

비즈니스 임팩트는 장기 에이전트 작업의 경제성에서 극대화된다. 3.5 플래시는 기존 프런티어 모델들과 비교해 절반 이하의 비용으로 복잡한 작업을 수행할 수 있다. 과거에 개발자가 며칠 동안 붙잡고 씨름하거나 전문 감사인이 몇 주에 걸쳐 검토해야 했던 방대한 작업들이 이제는 아주 짧은 시간 안에 완료된다. 새로운 애플리케이션을 설계하고 구축하는 과정은 물론, 거대한 코드베이스를 유지보수하는 작업에서도 효율이 극대화된다. 재무 문서 준비와 같은 정밀한 문서 작업에서도 빠른 계획 수립과 반복적인 수정이 가능하다. 실제 산업 현장에서 요구하는 빠른 반복 주기(Iteration)를 모델 수준에서 지원하게 되었다. 이는 기업이 AI 에이전트를 단순한 챗봇이 아니라 실질적인 업무 수행 도구로 전환하는 결정적 계기가 된다. 단순한 성능 개선을 넘어 AI 에이전트의 상용화 속도를 앞당기는 전략적 포석이다.

검색창의 소멸과 '정보 에이전트'가 만드는 새로운 사용자 경험

사용자가 직접 키워드를 입력해 결과를 훑는 방식은 이제 구식이다. 구글은 24시간 백그라운드에서 작동하는 정보 에이전트(Information Agents)를 전면에 내세웠다. 이 에이전트는 웹사이트와 뉴스, 소셜 포스트를 실시간으로 감시한다. 금융, 쇼핑, 스포츠 같은 실시간 데이터까지 모니터링 대상에 포함된다. 사용자가 묻기 전에 필요한 정보가 먼저 도착하고 요약되는 구조다. 검색의 정의가 능동적인 찾는 행위에서 수동적인 관리받는 경험으로 완전히 전환된다. 이는 정보의 비대칭성을 해결하는 방식이 검색 엔진에서 개인 비서로 옮겨갔음을 의미한다.

단발성 질문을 넘어 지속적인 과업을 수행하는 도구의 등장은 더 파격적이다. 결혼 준비나 이사 관리처럼 호흡이 긴 프로젝트를 위해 전용 대시보드와 트래커를 생성한다. 구글 안티그래비티(Google Antigravity, 에이전트 중심 개발 플랫폼)가 이를 실시간으로 구현한다. 사용자의 구체적인 목적에 맞게 레이아웃과 구성 요소가 즉석에서 설계되는 맞춤형 미니 앱 형태다. 기존의 정적인 검색 결과 페이지가 사라지고 개인화된 작업 공간이 그 자리를 대체하는 포석이다. 실무자 관점에서 이는 웹 페이지의 개념이 서비스 단위의 마이크로 앱으로 파편화되는 지형 변화를 예고한다.

개인 지능(Personal Intelligence)의 확장 범위는 구글의 데이터 생태계를 더욱 공고히 한다. 지메일(Gmail), 구글 포토(Google Photos), 구글 캘린더(Google Calendar)가 유기적으로 연결되어 개인의 맥락을 학습한다. 이 기능은 전 세계 200개국 98개 언어로 지원되며 구독 없이 제공되어 진입 장벽을 낮췄다. 여기에 유니버설 카트(Universal Cart)라는 통합 지능형 장바구니 허브가 추가된다. 구글 쇼핑의 모든 경로를 하나의 지능형 접점으로 통합해 구매 여정을 단축하고 전환율을 극대화하려는 전략이다. 이는 단순한 편의 기능을 넘어 이커머스 시장의 진입점을 구글이 완전히 장악하겠다는 계산이다.

콘텐츠 소비와 생산의 경계 역시 AI를 통해 무너진다. 유튜브 쇼츠 리믹스(YouTube Shorts Remix)에서는 사용자의 외형과 목소리를 닮은 AI 아바타를 생성해 영상에 투입할 수 있다. 기존에 업로드된 숏츠 영상의 배경이나 내용을 실시간으로 수정하고 편집하는 기능도 구현됐다. 사용자는 복잡한 편집 도구 없이 프롬프트만으로 영상의 문법을 바꾼다. 단순한 시청자를 넘어 AI를 통해 즉각적인 창작자로 변모시키는 장치다. 구글은 이를 통해 생태계 내 데이터 흐름을 검색에서 실행, 그리고 창작의 영역으로 확장하며 사용자 체류 시간을 극대화한다.

한국 AI 실무자가 주목해야 할 '안티그래비티'와 에이전틱 워크플로우

개발자가 체감하는 가장 큰 변화는 챗봇의 응답 창이 사라지는 지점이다. 구글이 공개한 안티그래비티(Google Antigravity, 에이전트 우선 개발 플랫폼)는 단순한 대화형 인터페이스의 한계를 넘는다. 검색 엔진이 질문의 성격에 맞춰 실시간으로 레이아웃을 설계하고 인터랙티브 시각 자료나 테이블, 그래프를 생성하는 제너레이티브 UI(Generative UI)를 구현한다. 사용자는 이제 텍스트 응답을 읽는 대신 목적에 최적화된 일회성 미니 앱을 제공받으며 복잡한 주제를 직관적으로 이해한다. 이는 LLM을 단순 API로 호출해 답변을 얻던 단계를 지나 서비스의 UI/UX 자체를 AI가 동적으로 생성하는 시대로의 진입을 의미한다. 한국의 서비스 기획자와 개발자에게는 정적인 화면 설계서보다 에이전트의 액션 흐름과 컴포넌트 조합 능력이 핵심 경쟁력이 된다.

개인 데이터의 연결 범위가 확장되면서 초개인화 서비스의 지형도 근본적으로 바뀐다. 구글은 한국어를 포함한 98개 언어로 퍼스널 인텔리전스(Personal Intelligence) 기능을 전 세계적으로 확대한다. 지메일(Gmail)이나 구글 포토, 캘린더 같은 개인 앱과 보안 연결을 통해 사용자의 삶 전반에 걸친 맥락을 완전히 장악한다. 단순한 정보 제공을 넘어 사용자의 실제 일정과 개인적 취향을 실시간으로 반영한 실행 단계까지 에이전트가 깊숙이 개입한다. 글로벌 표준 플랫폼이 다국어 지원과 개인 데이터 연결을 기본 사양으로 제공함에 따라 국내 기업들이 가졌던 언어적 우위나 로컬 데이터 기반의 진입장벽은 빠르게 무너진다. 이제는 어떤 데이터를 연결해 어떤 실질적 액션을 유도할 것인가라는 전략적 포석이 서비스의 생존을 결정한다.

검색 에이전트의 등장은 기존 버티컬 검색 서비스와 쇼핑 플랫폼의 비즈니스 모델을 위협한다. 24시간 백그라운드에서 작동하는 정보 에이전트는 블로그와 뉴스, 소셜 포스트뿐 아니라 금융과 쇼핑의 실시간 데이터를 상시 모니터링한다. 사용자가 특정 사이트에 접속해 정보를 검색하고 상품을 비교하던 기존의 탐색 여정이 통째로 사라진다. 여기에 유니버설 카트(Universal Cart, 지능형 통합 쇼핑카트) 같은 도구가 결합하면 에이전트가 최적의 정보를 합성해 업데이트하고 구매까지 즉각적으로 연결하는 구조로 시장이 재편된다. 이는 트래픽 유입을 기반으로 광고 수익을 내던 버티컬 플랫폼의 수익 구조에 치명적인 임팩트를 준다. 플랫폼의 가치는 이제 얼마나 많은 페이지 뷰를 확보하느냐가 아니라 에이전트 워크플로우의 핵심 접점을 얼마나 점유하느냐로 이동한다.