오후 2시, 캘리포니아 마운틴뷰의 구글 본사 캠퍼스.

전 세계에서 모인 개발자들이 대형 스크린 속 Gemini Omni의 시연 영상에 집중하고 있다. 텍스트나 이미지 같은 단편적 입력이 아니라 비디오를 포함한 모든 입력값으로부터 새로운 콘텐츠를 생성하고, 대화형 언어로 자연스럽게 편집하는 과정이 실시간으로 펼쳐진다. 특히 단순한 정보 제공을 넘어 사용자의 쇼핑 과정을 자동화하는 Universal Cart(유니버설 카트)의 구동 모습은 현장의 분위기를 바꾼다.

이 장면 뒤에 숨은 것은 단순한 모델 업데이트가 아니다. 그동안의 AI가 사용자의 질문에 답을 내놓는 '똑똑한 도구'였다면, 이제 구글은 사용자를 대신해 과업을 완수하는 '에이전트'로의 완전한 전환을 선언했다. 구글 I/O 2026에서 공개된 기술적 지향점은 명확하다. 지능(Intelligence)의 고도화를 넘어 실행(Action)의 영역으로 진입하는 것이다.

Gemini Omni와 3.5, 그리고 100달러의 AI Ultra 플랜

Gemini Omni는 비디오를 포함한 모든 형태의 입력으로부터 새로운 콘텐츠를 생성하고 대화형으로 편집하는 기능을 수행한다. 이는 기존의 단방향 생성 방식에서 벗어나 사용자가 대화를 통해 결과물을 실시간으로 수정하고 보완할 수 있는 환경을 구축한 것이다. 특히 비디오 입력에 대한 이해도를 높여 세계에 대한 인식 능력을 확장하고 멀티모달리티(Multimodality, 여러 형태의 정보를 동시에 처리하는 능력)를 극대화했다는 점이 핵심이다. 반면 Gemini 3.5는 프런티어 지능과 액션(Action, 실제 작업 수행 능력)을 결합한 최신 모델 시리즈로 설계되었다. 주목할 점은 구글이 생성 능력에 특화된 Omni와 실행력에 집중한 3.5로 라인업을 재편하며 모델의 목적성을 명확히 구분했다는 사실이다. 이는 단순한 성능 향상이 아니라 사용자가 AI에게 기대하는 역할이 창작과 실행으로 분화되고 있음을 반영한 결과다.

서비스 과금 체계에서도 파격적인 변화가 확인된다. 구글은 월 100달러라는 고가의 새로운 구독 요금제인 AI Ultra 플랜을 전격 도입했다. 이는 기존에 운영하던 AI Plus나 Pro 구독 모델의 가격대를 크게 상회하는 수치다. 그러나 이러한 고단가 전략은 단순히 수익 극대화를 위한 것이 아니라 고성능 모델의 막대한 연산 비용과 에이전트 기반의 복잡한 서비스 제공 비용을 감당하기 위한 구조적 선택으로 분석된다. AI Ultra 플랜 가입자에게는 기존 구독자보다 더 확장된 기능과 혜택이 제공되며, 이는 고도화된 지능을 필요로 하는 전문 사용자 층을 위한 별도의 세그먼트를 구축한 것으로 풀이된다.

AI의 접점은 소프트웨어의 영역을 넘어 하드웨어 폼팩터의 확장으로 이어진다. 올가을 출시를 앞둔 Intelligent Eyewear(지능형 안경)가 그 구체적인 사례다. 이 기기는 사용자가 스마트폰을 직접 꺼내지 않고도 실시간으로 방향 안내를 받고, 문자를 전송하며, 사진을 촬영하는 기능을 탑재했다. 이는 Gemini의 지능이 모바일 앱이라는 제한된 인터페이스를 벗어나 사용자의 시각적 경험과 일상적인 행동 패턴에 직접 통합되는 단계로 진입했음을 의미한다. 반면 이는 하드웨어 보급률이라는 새로운 변수를 마주하게 됨을 시사한다. 구글은 모델의 지능 고도화와 이를 뒷받침할 고가의 유료 플랜, 그리고 전용 하드웨어를 동시에 배치함으로써 AI 생태계의 진입 장벽과 수익 모델을 동시에 설계하고 있다.

Google Antigravity와 Project Genie의 동작 구조

개발자가 체감하는 변화는 단순한 텍스트 생성 능력이 아니라 에이전트의 제어권이다. 구글 안티그래비티(Google Antigravity, 에이전트 우선 개발 플랫폼)는 AI가 단순한 보조 도구를 넘어 직접 행동하는 에이전트로 진화하는 기반을 제공한다. 기존 AI 툴이 초안 작성이나 정보 요약 같은 정적인 작업에 머물렀던 반면, 이 플랫폼은 실행 중심의 설계를 통해 개발자가 에이전틱(Agentic, 스스로 목표를 설정하고 수행하는) 경험을 직접 구축하도록 돕는다. 주목할 점은 이러한 지능의 접점이 안드로이드 헤일로(Android Halo, 상태 표시줄 통합 지능 서비스)를 통해 사용자 인터페이스 최상단인 상태 표시줄에 직접 배치되었다는 사실이다. 이는 에이전트의 작동 상태와 현재 수행 중인 태스크를 OS 레벨에서 실시간으로 확인하고 제어하려는 구조적 시도로 분석된다. 결과적으로 개발 환경과 사용자 접점을 하나로 묶어 에이전트의 실행 효율을 극대화하는 구조를 취하고 있다.

물리적 세계에 대한 이해도는 프로젝트 지니(Project Genie, 가상 세계 시뮬레이션 도구)와 구글 스트리트 뷰(Google Street View)의 결합으로 구체화된다. 기존의 가상 시뮬레이션이 무작위로 생성된 합성 데이터나 제한된 3D 모델링에 의존했다면, 이번 구조는 20년 치의 실제 거리 뷰 이미지를 연결해 현실에 기반한 가상 세계를 구현한다. 반면 이는 단순한 시각적 재현을 넘어 AI가 현실의 공간 구조와 물리적 맥락을 학습하는 거대한 데이터셋으로 작동한다. 현실 데이터의 축적량이 모델의 세계 이해도와 직결된다는 점을 고려할 때, 방대한 아카이브를 시뮬레이션 엔진에 직접 연결한 방식은 학습 비용을 낮추고 정확도를 높이는 효율적인 경로를 확보한 결과다. 가상 세계 내에서 AI 에이전트가 현실의 물리 법칙과 지형지물을 학습함으로써 실제 환경에서의 동작 가능성을 검증하는 구조를 완성했다.

생성된 미디어의 신뢰성 확보를 위한 기술적 장치 역시 시스템 수준에서 확장되었다. 신스아이디(SynthID, AI 생성 콘텐츠 식별 기술)와 C2PA 콘텐츠 크리덴셜(C2PA Content Credentials, 콘텐츠 출처 및 수정 이력 증명 표준)을 통해 디지털 워터마킹의 적용 범위를 넓혔다. AI가 생성한 이미지나 영상이 정교해질수록 인간이 육안으로 진위를 판별하는 비용은 기하급수적으로 증가한다. 그러나 구글은 식별 기술을 플랫폼 수준에서 강제함으로써 생성물과 실제 데이터 사이의 경계를 명확히 구분하는 구조를 택했다. 이는 에이전트가 생성하는 결과물의 투명성을 확보하여 물리적 세계의 데이터와 AI가 생성한 가상 데이터 사이의 혼선을 방지하려는 제어 장치다. 결과적으로 데이터의 생성부터 식별까지의 파이프라인을 통합하여 AI 생성 미디어의 오남용 가능성을 기술적으로 차단하는 체계를 구축했다.

'지능'에서 '액션'으로: Gemini 3.5와 AI Mode의 차별점

기존의 거대언어모델들이 방대한 데이터를 요약하거나 텍스트를 생성하는 지능적 수행에 집중했다면, Gemini 3.5는 이를 실제 환경의 과업 수행으로 연결하는 액션(Action) 기능을 결합했다. 개발팀이 공개한 Gemini 3.5 Flash는 프론티어 지능과 액션 능력을 동시에 갖춘 첫 번째 모델로 정의된다. 이전 모델들이 사용자의 질문에 최적의 답변을 내놓는 것만으로 역할을 다했다면, Gemini 3.5는 외부 도구와 환경을 직접 제어하여 실질적인 결과물을 만들어내는 단계로 진입했다. 그러나 이러한 변화는 단순한 기능 추가가 아니라 모델의 설계 목적 자체가 정보 제공에서 과업 완수로 이동했음을 의미한다. 이는 모델이 텍스트라는 가상 공간을 넘어 실제 시스템과 상호작용하며 물리적 혹은 디지털 과업을 처리하는 에이전트로 진화했음을 보여주는 지표다.

사용자의 검색 행태 역시 AI Mode의 도입으로 인해 키워드 중심에서 자연어 쿼리(Natural language queries) 중심으로 빠르게 이동하고 있다. 과거의 검색이 특정 단어를 조합해 원하는 페이지를 찾는 수동적 과정이었다면, AI Mode는 사용자의 의도를 파악해 대화형으로 답을 찾아가는 능동적 구조를 취한다. 주목할 점은 구글 검색이 단순한 정보 제공형 서비스에서 정보 에이전트(Information agents) 기반의 체제로 전환되었다는 사실이다. 반면 기존 검색 엔진이 인덱싱된 웹페이지의 링크를 나열하는 방식에 머물렀다면, 정보 에이전트는 사용자가 필요로 하는 정보를 스스로 탐색하고 조합해 최종적인 해결책을 제시하는 능동적 검색을 수행한다. 이는 사용자가 검색어를 최적화해야 했던 과거의 인지적 부담을 AI가 대신 짊어지며 검색의 패러다임을 완전히 바꾼 결과다.

창작 도구 영역에서도 단순한 보조 도구에서 협업자로의 진화가 관찰된다. Google Flow(구글 플로우, 워크플로우 최적화 도구)와 Google Flow Music(구글 플로우 뮤직, AI 기반 음악 생성 도구)은 사용자의 명령을 수행하는 소프트웨어를 넘어 크리에이티브 협업자(Collaborator)의 역할을 수행한다. 이전의 AI 도구들이 정해진 템플릿에 따라 결과물을 생성하는 수준이었다면, 이번 업데이트 이후의 모델들은 창작자의 의도를 실시간으로 반영하며 함께 결과물을 다듬어가는 상호작용 방식을 채택했다. 단순한 도구는 입력값에 따른 출력값만을 제공하지만, 협업자는 맥락을 이해하고 대안을 제시하며 창작 과정에 개입한다. 이러한 변화는 AI가 단순한 생산성 도구의 영역을 벗어나 창의적 프로세스 자체에 깊숙이 개입하는 에이전틱(Agentic) 환경으로 진입했음을 보여주는 구체적인 사례다.

Universal Cart부터 Co-Scientist까지, 산업별 실질 영향

쇼핑카트에 상품을 담는 행위는 이제 단순한 목록 작성이 아니다. 구글이 선보인 Universal Cart(유니버설 카트, 지능형 쇼핑카트)는 에이전틱 커머스(Agentic commerce, 사용자의 의도를 파악해 구매 과정 전체를 수행하는 상거래)의 기반을 구축한다. 기존의 커머스가 검색과 선택이라는 사용자 주도의 단계적 프로세스에 의존했다면, 이번 모델은 에이전트가 구매 맥락을 이해하고 최적의 경로를 제안하는 방식으로 전환된다. 주목할 점은 단순한 추천 시스템을 넘어 결제와 배송 최적화까지 연결되는 실행력에 있다. 이는 소비자 경험의 파편화를 줄이고 구매 전환율을 높이는 실질적인 도구로 작용하며, 커머스 플랫폼 개발자들에게는 단순 UI 개선이 아닌 에이전트 중심의 워크플로우 설계라는 새로운 과제를 던진다. 검색의 시대에서 실행의 시대로 넘어가는 상업적 전환점이 여기서 시작된다.

연구실의 풍경 역시 변화하고 있다. Co-Scientist(코-사이언티스트, 연구 가속화를 위한 AI 파트너)는 Gemini를 기반으로 한 멀티 에이전트 시스템을 통해 과학적 발견의 속도를 높인다. 단일 모델이 정답을 내놓는 방식이 아니라, 서로 다른 역할을 가진 여러 전문 에이전트가 협업하여 가설을 세우고 검증하는 구조를 취한다. 반면 Gemini for Science(제미나이 포 사이언스, 과학 탐구 전용 도구 모음)는 탐구의 규모와 정밀도를 확장하는 데 집중한다. 연구자가 수작업으로 처리하던 방대한 데이터 분석과 문헌 검토 시간을 획기적으로 단축함으로써, 과학적 탐구의 임계점을 낮추는 결과로 이어진다. 이는 연구자에게 단순한 보조 도구를 제공하는 수준을 넘어, 데이터 처리의 병목 현상을 제거하고 가설 검증의 사이클을 가속화하는 연구 인프라의 근본적인 변화를 의미한다. 정밀도의 확장은 곧 발견의 빈도 증가로 연결된다.

재난 예측 분야에서는 이미 구체적인 성과가 도출되었다. WeatherNext AI(웨더넥스트 AI, 기상 예측 특화 AI)는 미국 국립허리케인센터(National Hurricane Center)와 협력해 허리케인 멜리사(Melissa)의 자메이카 상륙 지점과 시점을 예측했다. 과거의 기상 예측이 수치 모델의 계산 결과에 의존해 오차 범위가 컸던 것과 대조적이다. AI 에이전트가 실시간 기상 데이터와 과거 패턴을 동시에 분석하며 예측의 정밀도를 높인 결과다. 그러나 이러한 성과는 단순한 모델 성능 향상이 아니라, 특정 도메인의 전문 데이터와 에이전틱 워크플로우가 결합했을 때 발생하는 실질적 효용을 증명한다. 이는 AI가 텍스트 생성을 넘어 물리적 세계의 위험을 관리하는 제어권 영역으로 진입했음을 보여주며, 공공 안전 시스템의 운영 방식을 데이터 기반의 실시간 대응 체계로 전환시키는 계기가 된다.

Android 네이티브 지원과 '바이브 코딩'이 한국 개발자에게 주는 의미

구글 AI 스튜디오(Google AI Studio, 구글의 AI 모델 프로토타이핑 도구)가 네이티브 안드로이드 바이브 코딩(Vibe coding, 정교한 문법보다 의도와 흐름 중심의 코딩 방식) 지원과 모바일 앱 출시를 단행했다. 기존 안드로이드 개발 환경에서는 코틀린(Kotlin)이나 자바(Java) 기반의 엄격한 문법 체계와 복잡한 빌드 과정이 필수적이었으며 이는 개발 초기 단계에서 상당한 리소스를 소모하게 만들었다. 반면 이번 업데이트는 개발자가 자연어로 의도를 전달하면 AI가 즉각적으로 네이티브 코드로 구현하는 환경을 제공함으로써 아이디어의 구체화 속도를 극대화한다. 이는 단순한 코드 생성을 넘어 모바일 앱 출시까지의 전체 파이프라인을 극도로 단축시킨다는 점에서 실무적인 파급력이 크다.

주목할 점은 구글 워크스페이스(Google Workspace, 구글의 협업 툴 세트)와의 통합 수준이다. 지메일(Gmail), 문서(Docs), 킵(Keep) 내에 새로운 음성 기능이 도입되었으며 AI 인박스(AI Inbox, AI 기반의 지능형 메일함) 업데이트를 통해 정보 수집과 분류 방식이 근본적으로 변경되었다. 그러나 이는 단순한 사용자 편의 기능의 추가가 아니라 개발자에게 새로운 데이터 인터페이스를 제공하는 것과 같다. 워크스페이스의 데이터가 AI 스튜디오와 유기적으로 연결됨에 따라 개발자는 사용자의 실제 업무 흐름과 맥락을 정확히 반영한 에이전트 기반 앱을 구축하는 데 드는 비용을 획기적으로 낮출 수 있다.

디자인과 구현의 경계 역시 빠르게 무너지고 있다. 구글 스티치(Google Stitch, 실시간 레이아웃 가이드 및 리플로우 디자인 도구)는 실시간으로 레이아웃을 가이드하고 리플로우(Reflow, 화면 크기에 따라 콘텐츠 배치를 자동 조정하는 기능)를 지원하여 디자인 수정 사항이 즉각적으로 반영되는 환경을 구축했다. 이와 함께 포멜리(Pomelli, 브랜드 북 디자인 및 웹사이트 런칭 지원 AI 에이전트)가 도입되어 브랜드 정체성 확립부터 실제 웹사이트 런칭까지의 전 과정을 AI 에이전트가 보조한다. 과거에는 디자이너의 시안을 개발자가 일일이 코드로 옮기는 과정에서 소통 오류와 병목 현상이 빈번하게 발생했다. 반면 이제는 AI 에이전트가 브랜드 가이드라인을 이해하고 이를 즉시 구현 가능한 레이아웃으로 변환하여 개발 효율을 높인다.

한국의 앱 생태계는 빠른 시장 검증과 잦은 업데이트가 생존 조건인 초경쟁 환경이다. 이러한 특성상 바이브 코딩과 네이티브 지원의 결합은 개발 진입 장벽을 낮추는 동시에 MVP(Minimum Viable Product, 최소 기능 제품) 제작 속도를 비약적으로 높이는 촉매제가 된다. 다만 기술적 숙련도보다 AI를 정교하게 제어하는 프롬프트 엔지니어링 능력이 더 중요해지는 시점이 도래했다는 점은 실무자들에게 새로운 도전 과제다. 결국 한국 개발자의 역할은 세부 문법의 구현이라는 단순 노동에서 벗어나 전체적인 서비스 아키텍처 설계와 AI가 생성한 결과물의 무결성을 검증하는 고차원적인 관리 영역으로 빠르게 이동하고 있다.