Google의 새 엔진, 영상 편집과 에이전트 업무를 바꾸다

영상 편집 프로그램의 타임라인에서 프레임 단위로 작업하던 방식이 텍스트 명령 기반의 실시간 편집으로 바뀐다. Google이 I/O 2026에서 발표한 Gemini Omni와 Gemini 3.5 모델 시리즈는 영상과 같은 복합 데이터를 이해하고 실무적인 에이전트 업무를 수행하는 데 초점을 맞췄다. 기존 대형 모델의 추론 능력을 실제 실행 가능한 워크플로우로 연결해 영상 편집, 데이터 분류, 디지털 환경 관리 등의 실무 현장에 적용한다.

Gemini Omni와 3.5 Flash: 멀티모달 생성과 에이전트 성능의 결합

Gemini Omni는 이미지, 오디오, 비디오, 텍스트를 통합 입력받아 고품질 영상을 생성하고 편집한다. "조각상을 거품으로 만들어달라"거나 "방 안의 조명을 낮춰달라"는 자연어 명령으로 영상 속 객체와 환경을 즉각 변경하며, 여러 차례의 대화를 거쳐도 장면의 맥락과 물리 법칙을 유지한다. 생성과 추론을 하나의 모델에서 처리해 영상의 일관성을 확보한 구조다.

코딩과 장기 과제 수행은 Gemini 3.5 Flash가 담당한다. AI Studio에서 결제 흐름(checkout flow)에 대한 다양한 UX 접근 방식을 생성하는 데 60초가 소요되며, 수학적 개념인 파이(Pi) 시각화나 64개의 프랙탈 변형을 고속으로 만들어낸다. 추론 성능을 유지하면서 실행 속도를 높여 실무 에이전트로서의 활용성을 높였다.

구글은 이 모델들을 서비스 전면에 배치했다. Gemini 3.5 Flash는 전 세계 Gemini 앱과 검색 내 AI 모드의 기본 모델로 적용되었다. Gemini Omni Flash는 Google AI Plus, Pro, Ultra 구독자에게 순차 배포되며, YouTube Shorts와 YouTube Create 앱 사용자에게는 무료로 제공된다. 미국 내 Ultra 구독자에게는 워크스페이스 도구와 통합되어 24시간 작동하는 개인 AI 에이전트 Gemini Spark(제미나이 스파크)가 제공된다.

Antigravity 프레임워크를 통한 에이전트 워크플로우 자동화

구글은 Gemini 3.5 Flash와 Antigravity(대규모 에이전트 작업 실행 하네스)를 결합해 다단계 작업 자동화를 구현했다. Antigravity는 Gemini 3.5 Flash가 목적에 맞는 다중 서브 에이전트를 배포해 복잡한 과제를 수행하도록 돕는 기반 구조다. 이를 통해 비정형 자산의 이름을 자동으로 변경하고 동적 기준에 따라 분류하는 워크플로우를 실행하며, 실제 파일과 데이터를 다루는 실행 단계의 자동화를 지원한다.

특히 병렬 처리 능력을 통해 작업 시간을 단축한다. 단일 모델이 순차적으로 답을 내놓는 방식 대신, 여러 에이전트가 협업해 대량의 결과물을 한꺼번에 생성하는 구조를 갖췄다. 이는 고도의 지능과 빠른 속도가 동시에 필요한 그래픽 생성 및 코딩 작업에서 실질적인 시간 단축을 이끌어낸다.

사용자의 감독 하에 다단계 워크플로우와 코딩 작업을 안정적으로 실행하며, 반복적인 수정 단계를 자동화 루프로 전환해 개발 생산성을 높이는 구조를 구현했다. 프론티어급 성능과 속도의 균형을 통해 롱호라이즌(long-horizon, 장기적 관점의 복잡한) 작업의 실무 활용도를 높인 결과다.

검색과 워크스페이스를 파고드는 개인화된 AI 에이전트

구글은 24시간 백그라운드에서 작동하는 정보 에이전트(Information Agents)를 도입한다. 이 에이전트는 사용자가 검색하지 않아도 정보를 추론해 맞춤형 업데이트와 웹 링크를 제공하며, 올여름 구글 AI Pro 및 Ultra 구독자를 대상으로 먼저 출시된다. 검색 방식이 사용자의 요청에 응답하는 수동적 형태에서 에이전트가 먼저 정보를 제안하는 능동적 방식으로 바뀐다.

검색 결과는 즉석에서 생성되는 기능적 도구로 변한다. Gemini 3.5 Flash와 Antigravity를 결합해 사용자의 질문에 맞는 대시보드, 트래커, 미니 앱 등의 생성형 UI를 실시간으로 구축하며, 이 기능은 올여름 모든 사용자에게 무료로 제공된다. AI가 정적인 답변을 내놓는 수준을 넘어 사용자 맞춤형 인터페이스를 직접 설계하고 배포하는 단계로 진입했다.

워크스페이스 통합은 Gemini Spark에서 구체화된다. Gemini 3.5와 Antigravity 기반의 Gemini Spark는 Gmail, Docs, Slides 등 구글 워크스페이스 도구와 연동되어 사용자를 대신해 액션을 수행한다. 현재 미국 내 Google AI Ultra 구독자에게 제공되며, 특정 조건의 간식 리스트를 만든 뒤 이를 인스타카트(Instacart) 장바구니에 추가하는 식의 실무 대행이 가능하다.

한국 실무 환경에서의 에이전트 도입과 확장성

Gemini 3.5 Flash는 Google Antigravity, Gemini API, Android Studio를 통해 개발자에게 제공된다. 실무자는 Gemini Enterprise Agent Platform(기업용 에이전트 구축 플랫폼)을 활용해 특정 업무 환경에 최적화된 맞춤형 에이전트를 설계할 수 있다. 이는 기업이 자체적인 비즈니스 프로세스를 자동화할 수 있는 인프라가 갖춰졌음을 의미한다.

개발자와 엔터프라이즈 고객을 위한 API 배포는 향후 수주 내로 예정되어 있다. 다단계 워크플로우를 수행하는 에이전트를 기업의 내부 시스템과 결합해 반복 업무를 자동화하고, 실시간 비즈니스 요구사항에 맞춰 응답을 생성하는 엔진으로 활용할 수 있다.

사용자 경험 측면에서는 개인화된 대시보드 및 트래커 구축 기능이 미국 내 Google AI Pro 및 Ultra 구독자부터 순차적으로 확대 적용된다. 한국의 기업 고객 또한 향후 자신의 서비스 내에 사용자를 위한 전용 대시보드나 미니 앱 형태의 인터페이스를 구축할 수 있다. 실무 현장에서는 이러한 도구를 통해 데이터 시각화와 에이전트의 판단을 결합한 사용자 경험을 설계할 수 있게 되었다.

구글의 새 엔진은 수 시간 분량의 영상을 한 번에 처리하고 복잡한 에이전트 업무를 자율적으로 수행하는 단계에 진입했다. 단순한 텍스트 질의응답을 넘어 영상 편집의 공정을 단축하고 실질적인 워크플로우를 자동화하는 결과로 이어진다. 이는 AI의 정체성이 정보를 찾아주는 검색 도구에서 업무를 완수하는 실행자로 전환되는 구체적인 지점이다. 기술적 가능성을 넘어 실무의 병목 구간을 직접 해결하는 에이전트의 등장이 생산성의 기준을 바꾼다.