단순 답변 끝났다, 구글 Gemini 3.5가 여는 '실행형 에이전트' 시대

Gemini 3.5와 Omni, '에이전트'로의 전환

AI는 질문에 답을 내놓는 수동적인 챗봇이라고 믿었다. 사용자가 질문을 던지고 AI가 답을 내놓을 때까지 기다리는 경험이 표준이었다. 구글은 2026년 5월 Google I/O 2026과 Android Show에서 이 전제를 깼다. Gemini 3.5와 Gemini Omni를 통해 AI를 실행 능력을 갖춘 에이전트로 정의했다. Gemini 3.5는 에이전트와 코딩을 위한 프런티어 지능 모델이다. 이 모델은 앱 전반에서 복잡한 다단계 에이전트 워크플로우를 스스로 실행한다. 단순한 정보 제공을 넘어 실제 업무를 완결 짓는 도구로의 전환이다.

Gemini Omni는 추론 능력과 생성 능력을 결합한 멀티모달 모델이다. 이미지, 오디오, 비디오, 텍스트 입력을 모두 결합해 고화질 비디오를 생성한다. Gemini 3.5 Flash는 검색 내에서 코딩 능력을 수행하며 인터랙티브한 비주얼과 대시보드, 미니 앱을 구축한다. 입력값에 따라 결과물을 내놓는 단계를 지나 AI가 직접 환경을 설계하고 실행하는 단계로 진입했다.

사용자 접점인 Gemini 앱의 UI가 전면 업데이트됐다. 개인화된 데일리 브리프와 Gemini Spark가 도입됐다. AI는 단순히 질문에 답하지 않고 백그라운드에서 메일함을 관리하고 일정을 예약하며 사용자의 필요를 미리 예측하는 선제적 헬퍼로 동작한다. Android Halo는 폰 내에 마련된 에이전트 전용 공간이다. 사용자는 이곳에서 에이전트의 작업 진행 상황을 실시간으로 확인하고 자신의 작업 흐름을 방해받지 않은 채 맥락적 도움을 받는다.

구글의 이번 행보는 AI의 정체성을 지식 검색기에서 업무 수행기로 옮긴다. 사용자는 이제 답변의 정확도보다 실행의 완결성을 기준으로 AI 도입 여부를 판단한다. 단순한 정보 제공자가 아닌 실제 업무를 수행하는 실행 도구로서의 가치를 측정하는 것이다. API 연결을 통한 단순 자동화를 넘어 모델 자체가 워크플로우를 설계하고 제어하는 구조다. AI 서비스의 경쟁 축이 인터페이스의 편리함에서 실제 업무 수행력으로 이동했다.

24시간 백그라운드 실행과 멀티모달 생성 원리

챗봇에게 질문을 던지고 답변이 출력될 때까지 기다리던 수동적 경험은 빠르게 사라지고 있다. Gemini 3.5는 사용자의 개입 없이 앱 전반에서 복잡한 다단계 에이전트 워크플로우를 스스로 설계하고 실행한다. 검색창에 도입된 정보 에이전트는 24시간 백그라운드에서 지정된 데이터를 지속적으로 모니터링하며 변화를 추적한다. 특정 조건이 충족되거나 유의미한 정보 변화가 감지되면 AI가 먼저 사용자에게 상세 업데이트와 즉시 실행 가능한 링크를 전송한다. 사용자가 매번 검색어를 입력해 정보를 확인하던 반복적인 대기 시간을 AI가 백그라운드 자동 처리로 완전히 압축했다. AI가 단순한 정보 제공자를 넘어 실무를 수행하는 실행 도구로 전환됐다.

입력과 출력의 형태도 완전히 바뀐다. Gemini Omni는 이미지, 오디오, 비디오, 텍스트를 동시에 입력받아 이를 하나의 컨텍스트로 통합 처리한다. 이렇게 결합된 멀티모달 입력은 구글이 보유한 방대한 실세계 지식 베이스와 연결되어 고화질 비디오 생성으로 이어진다. Project Genie와 스트리트 뷰의 결합은 브라우저 내에서 실제 장소의 인터랙티브 3D 환경 시뮬레이션을 구현한다. 사용자는 단순한 2D 지도를 보는 대신 가상 공간 속에서 실제 장소를 자유롭게 탐색하고 상호작용하는 경험을 한다. 단순한 텍스트와 이미지 중심의 정적인 정보 소비가 실시간 시뮬레이션으로 대체되는 구조다.

검색창은 이제 소프트웨어를 즉석에서 만드는 개발 환경으로 작동한다. Gemini 3.5 Flash는 검색 결과 내에서 생성형 UI와 인터랙티브 비주얼, 대시보드, 미니 앱을 직접 구축한다. 사용자가 검색창에 특정 기능을 요청하면 실시간 리뷰, 라이브 지도, 날씨 데이터를 API 형태로 호출해 커스텀 피트니스 트래커를 즉시 코딩한다. 코딩 과정이 백엔드에서 실시간으로 처리되어 사용자에게는 즉시 실행 가능한 앱 형태로 제공된다. 별도의 개발 도구 설치나 복잡한 설정 없이 검색어만으로 맞춤형 소프트웨어가 생성되는 방식이다. 검색의 목적이 단순한 정보 탐색에서 사용자의 필요에 맞는 즉각적인 도구 생성으로 확장됐다.

구글북과 Fitbit Air, AI의 물리적 접점 확장

필요한 파일을 찾으려 폴더를 뒤지고, 작업 창을 여러 개 띄워 정보를 옮긴다. 이 단순한 전환 과정이 업무 흐름을 끊는 주범이다. 구글은 Gemini Intelligence 전용 노트북인 구글북(Googlebook)을 통해 이 지점을 공략한다. 매직 포인터(Magic Pointer)가 사용자의 현재 작업 맥락을 실시간으로 분석해 최적의 다음 행동을 제안한다. 커스텀 위젯은 사용자가 설정한 우선순위에 따라 파편화된 업무 도구들을 한 화면에 배치한다. 하드웨어 제조는 에이서(Acer), 에이수스(Asus), 델(Dell), HP, 레노버(Lenovo)가 담당하며 구글의 AI 최적화 설계안을 바탕으로 기기를 양산한다. AI 에이전트가 OS 레벨에서 구동되는 전용 하드웨어 표준을 구축하려는 시도다.

쇼핑을 하려면 검색창에서 상품을 찾고, 리뷰를 위해 유튜브를 켜며, 결제 단계에서 다시 쇼핑몰 앱으로 이동해야 한다. 유니버설 카트(Universal Cart)는 이 단절된 경로를 하나로 묶는다. 구글 검색, Gemini, 유튜브, 지메일(Gmail) 등 서비스 구분 없이 상품을 담는 통합 쇼핑 허브다. 사용자는 플랫폼을 이동하지 않고도 탐색부터 담기까지의 구매 여정을 완결한다. 이는 개별 서비스의 트래픽을 통합해 커머스 전환율을 높이는 직접적인 장치가 된다. 검색과 콘텐츠 소비, 구매라는 서로 다른 사용자 경험을 하나의 워크플로우로 통합해 사용자가 생태계를 벗어나지 않고 소비를 끝내게 만드는 락인(Lock-in) 기제로 작동한다.

건강 상태를 확인하기 위해 매번 스마트폰 앱을 켜고 데이터를 동기화하는 과정은 번거롭다. 핏빗 에어(Fitbit Air)는 조약돌 형태의 소형 트래커로 이 과정을 자동화한다. 24시간 심박수와 심장 리듬을 상시 측정해 심방세동(Afib) 알림을 보내며, 혈중 산소 포화도(SpO2)와 수면 단계까지 정밀하게 추적한다. 지능형 안경(Intelligent Eyewear)은 폰을 꺼내지 않고 실시간 방향 안내를 받고 문자를 보내며 사진을 찍게 한다. AI가 화면 속 비서에서 사용자의 신체와 시야에 밀착된 상시 실행 도구로 진화했다. 하드웨어를 통한 데이터 수집 경로를 확장해 AI 에이전트의 판단 근거를 생체 정보와 시각 정보로 넓힌 결과다.

아태지역 엑셀러레이터와 1,000만 달러 규모의 양자 AI 투자

범용 AI 모델의 구독료가 실제 연구소의 실험 횟수를 줄이거나 공장의 공정 효율을 직접적으로 높이고 있는가. 구글은 Gemini for Science를 통해 과학적 탐구의 규모와 정밀도를 높이는 전용 도구와 실험 세트를 공개했다. 이는 단순한 챗봇 인터페이스가 아니라 연구 데이터의 정밀 분석을 위한 전용 환경을 제공한다. AlphaEvolve는 물류 공급망 최적화와 칩 설계라는 구체적인 산업 과제에 투입됐다. 분자 시스템 시뮬레이션과 전력망 시뮬레이션에도 적용되어 국가 기간망 수준의 물리적 변수를 계산한다. AI가 텍스트 생성을 넘어 고도의 산업 설계와 물리 시뮬레이션 영역으로 진입했다.

자본의 흐름은 더 구체적인 전문 영역과 지역으로 향한다. 구글 딥마인드 엑셀러레이터(Google DeepMind Accelerator)가 아시아 태평양 지역에서 런칭됐다. 기후와 에너지, 환경 문제를 해결하는 스타트업을 집중 지원하며 지역 특화 솔루션을 확보한다. 생명과학과 양자 AI의 교차 연구를 위한 REPLIQA(Research Program at the Intersection of Life Sciences & Quantum AI) 프로그램에는 1,000만 달러가 투입됐다. 선정된 5개 대학은 양자 과학과 AI를 결합해 생명공학의 실질적 성과를 내는 연구를 수행한다. 이는 범용 모델 경쟁을 넘어 양자 컴퓨팅이라는 차세대 하드웨어와 AI의 결합 지점을 선점하려는 움직임이다.

전문 영역의 AI 도입은 결과물의 신뢰성 확보가 전제되어야 한다. 구글은 Search, Gemini, Chrome, Pixel, Cloud 전반에 AI 생성 콘텐츠 확인 기능을 확대한다. 콘텐츠 투명성 도구를 통해 온라인상에서 AI가 만든 결과물인지 여부를 즉각 검증한다. 데이터의 진위 확인은 오차가 치명적인 과학 및 의료 분야 AI 도입의 필수 조건이다. 검증 도구를 플랫폼 전반에 통합하는 것은 AI 결과물을 실제 산업 현장의 최종 의사결정에 활용하기 위한 인프라 구축 작업이다. 신뢰할 수 있는 데이터 흐름이 확보되어야 전문 영역의 AI 에이전트가 실질적인 실행 권한을 가질 수 있다.

질문하고 답을 기다리던 수동적 AI 경험은 끝났다. Gemini 3.5는 앱 전반에서 복잡한 다단계 에이전트 워크플로우를 스스로 실행한다. Gemini Omni의 고화질 비디오 생성과 Gemini 3.5 Flash의 검색 내 코딩 능력은 AI가 단순한 인터페이스를 넘어 실질적인 도구로 작동함을 증명한다.

이제 기업은 AI가 얼마나 정확한 답을 내놓는지가 아니라, 얼마나 많은 업무 단계를 스스로 완결하는지를 따져야 한다. AI의 경쟁력은 정보 제공자가 아닌 실행 도구로서의 효용성에서 결정된다.