Google가 코딩 및 자율 AI 에이전트 최적화 모델인 Gemini 3.5 Flash를 공개했다. 이번 모델은 연례 개발자 컨퍼런스인 I/O에서 소개되었으며, 내부 테스트 결과 코딩 파이프라인의 독립적 실행과 연구 프로젝트 관리, 그리고 운영체제(OS)를 바닥부터 구축하는 능력을 입증했다. 주목할 점은 Google의 AI 지향점이 단순한 대화형 챗봇에서 실무를 직접 수행하는 에이전틱(Agentic, 자율적 실행) 도구로 전환되었다는 사실이다. 이는 사용자의 최소한의 입력만으로 계획 수립, 구축, 반복 작업을 수행하는 구조를 의미한다.

DeepMind의 최고 기술 책임자인 Koray Kavukcuoglu는 Gemini 3.5 Flash가 코딩, 에이전트 작업, 멀티모달 추론 등 거의 모든 벤치마크에서 기존 최신 모델인 3.1 Pro를 앞섰다고 밝혔다. 특히 속도 측면에서 다른 프런티어 모델보다 4배 빠르며, 최적화 버전의 경우 동일 품질을 유지하면서 12배 더 빠른 속도를 구현했다. 이러한 저지연 특성은 여러 AI 에이전트가 동시에 구동되어 장기 과제를 수행해야 하는 에이전트 워크플로우의 핵심 설계 요소로 작용한다.

Gemini 3.5 Flash의 성능 지표와 Antigravity 2.0 출시

개발팀이 공개한 수치는 여기서 갈린다. Google이 최근 공개한 Gemini 3.5 Flash는 이전 세대인 3.1 Pro와 비교해 코딩, 에이전트 작업, 멀티모달 추론 벤치마크 전반에서 우위를 점했다. 단순히 성능 지표가 상승한 것이 아니라 응답 속도에서 유의미한 격차가 벌어졌다. 타 프런티어 모델 대비 4배 빠른 속도를 기록했으며, 최적화 버전의 경우 동일한 품질을 유지하면서도 속도를 12배까지 끌어올렸다. 그러나 이러한 속도 향상은 단순한 수치 경쟁이 아니라 에이전트 작업의 효율성을 극대화하기 위한 설계 결과다. 여러 AI 에이전트가 동시에 구동되어 장기 과제를 수행해야 하는 환경에서는 지연 시간이 곧 생산성 저하로 이어지기 때문이다. 특히 코딩 파이프라인의 독립적 실행이나 연구 프로젝트 관리와 같은 고부하 작업에서 이 속도 차이는 체감 성능의 핵심 변수로 작용한다.

주목할 점은 모델의 성능을 구현하기 위해 전용 환경을 함께 출시했다는 사실이다. Google은 에이전트 우선 개발용 데스크톱 애플리케이션인 Antigravity 2.0(안티그래비티 2.0)을 공개했다. Gemini 3.5 Flash는 설계 단계부터 Antigravity와 공동 개발되었으며, 이를 통해 에이전트가 상주하며 작업을 수행하고 실행할 수 있는 네이티브 환경을 확보했다. 실제 시연에서는 여러 에이전트가 각각의 구성 요소를 분담해 작업한 뒤, 이를 통합해 운영체제(OS) 전체를 처음부터 구축하는 과정이 확인되었다. 반면 기존의 AI 도구들이 주로 질문에 답하는 대화형 인터페이스에 의존했다면, 이번 업데이트는 AI가 스스로 계획을 세우고 구축하며 반복 수정하는 에이전트 도구로서의 성격이 강하다. 이는 모델이 단순한 텍스트 생성을 넘어 실제 작업 환경 내에서 실행 권한을 가지고 움직이는 체제로의 전환을 의미한다.

이러한 에이전트 중심 체제는 개인용 서비스 영역으로도 확장된다. 24시간 상주하며 사용자의 디지털 라이프 관리를 돕는 개인용 AI 에이전트 Gemini Spark(제미나이 스파크)가 그 예다. Gemini 3.5 Flash는 현재 Gemini 앱과 검색의 AI 모드에 기본 모델로 적용되었으며, 사용자가 직접 AI 에이전트를 생성하고 관리할 수 있는 기능이 검색 플랫폼에 통합된다. 다만 고도의 추론 능력이 필요한 영역에서는 향후 출시될 3.5 Pro가 오케스트레이터(전체 흐름을 조율하는 관리자) 역할을 수행하고, Flash가 하위 에이전트로 작동하는 협업 구조를 취할 예정이다. 이는 무조건적인 모델 대형화보다는 추론 능력이 필요한 지점과 단순 도구 사용 능력이 필요한 지점을 구분하여 자원을 배분하겠다는 전략이다. 결과적으로 Flash는 빠른 실행력과 도구 활용 능력을 바탕으로 실제 업무의 말단 실행 단계를 전담하는 구조를 갖게 된다.

3.5 Pro와 Flash의 계층적 협업 구조 및 동작 방식

개발자가 체감하는 구조적 변화는 단일 모델의 성능 향상이 아니라 모델 간의 정교한 역할 분담이다. 3.5 Pro는 오케스트레이터(전체 작업 흐름을 설계하고 조정하는 제어 장치) 및 플래너 역할을 수행하며 전체적인 추론 방향과 전략을 결정한다. 반면 3.5 Flash는 Pro의 지시를 받는 하위 에이전트(특정 세부 과업을 수행하는 독립적 실행 단위)로서 실제 도구 사용과 실행 단계를 담당한다. 고도의 추론 능력이 요구되는 설계 단계에서는 Pro의 연산력을 집중적으로 활용하고, 단순 반복이나 빠른 응답이 필요한 실행 단계에서는 Flash의 저지연 특성을 이용하는 계층적 구조를 채택했다. 주목할 점은 이러한 분리가 단순한 효율화를 넘어, 복잡한 추론이 필요한 지점과 단순한 도구 활용 능력이 필요한 지점을 구분하여 자원을 배분하는 전략적 선택이라는 사실이다.

실행 환경의 변화는 Antigravity(에이전트 개발 플랫폼 및 IDE(통합 개발 환경))의 도입으로 구체화된다. 기존의 AI 모델들이 외부 API를 통해 텍스트 기반의 가이드를 제공하거나 코드 스니펫을 제안하는 수준에 그쳤다면, 이번 구조에서는 에이전트가 실제로 거주하고 작업하며 코드를 직접 실행할 수 있는 네이티브 환경을 구축했다. Flash 3.5는 Antigravity와 공동 개발되어 실행 환경 내에서 유기적으로 동작하며, 여러 개의 하위 에이전트가 동시에 서로 다른 컴포넌트를 작업한 뒤 이를 최종적으로 통합하여 운영체제와 같은 복잡한 결과물을 만들어내는 방식의 협업을 수행한다. 그러나 이러한 환경은 단순히 속도를 높이는 것에 그치지 않고, 에이전트가 실행 결과에 따라 계획을 수정하고 다시 실행하는 반복적 루프를 가능하게 만든다.

자율 실행 과정에서 발생하는 결정 지점이나 권한 문제는 별도의 사용자 입력 요청 프로세스를 통해 제어된다. 모델이 수 시간 동안 독립적으로 작업을 수행하며 파이프라인을 관리할 수 있는 능력을 갖췄음에도 불구하고, 인간의 판단이 필수적인 권한 승인이나 핵심적인 설계 변경 시점에는 동작을 일시 정지하고 사용자에게 입력을 요청한다. 이는 자율 에이전트가 가질 수 있는 제어권 상실 리스크를 방지하고 최종 결과물의 정밀도를 확보하기 위한 필수적인 안전장치다. 반면 단순한 도구 호출이나 데이터 처리, 코드 수정과 같은 하위 작업 단계에서는 사용자 개입 없이 Flash가 즉각적으로 반응하며 전체 작업 속도를 극대화한다. 결과적으로 Pro의 고차원적 설계 능력과 Flash의 물리적 실행 속도, 그리고 인간의 감독 권한이 결합된 계층적 제어 구조를 완성한 셈이다.

에이전트 대중화에 따른 실무 자동화와 안전성 리스크

은행과 핀테크 기업들이 수 주(Multi-week) 단위로 이어지는 업무 워크플로우를 자동화하는 단계에 진입했다. 이전의 AI 활용이 단발성 질의응답이나 단순 문서 요약에 그쳤다면, 이제는 복잡한 금융 프로세스를 스스로 계획하고 실행하는 에이전트 체제로 전환된 결과다. 데이터 과학 팀 역시 파편화된 복잡한 데이터 환경 내에서 직접 인사이트를 도출하는 과정에 이 모델을 실무적으로 활용하고 있다. 이는 분석가가 가설을 세우고 쿼리를 작성하던 기존 방식에서, AI가 데이터 탐색부터 결과 도출까지의 파이프라인을 자율적으로 수행하는 방식으로의 변화를 의미한다. 그러나 이러한 자율성의 확대는 단순한 효율성 증대를 넘어, AI가 인간의 개입 없이 장시간 작업을 수행한다는 점에서 제어권과 책임 소재의 문제를 야기한다.

사용자 접점에서의 변화는 더욱 광범위하고 직접적이다. Gemini 3.5 Flash는 현재 전 세계 Gemini 앱과 검색 AI 모드의 기본 모델로 적용되어 일반 사용자들에게 보급되었다. 특히 검색 플랫폼 내에서 사용자가 직접 AI 에이전트를 생성하고, 자신의 목적에 맞게 커스텀하며, 이를 통합적으로 관리할 수 있는 기능이 추가된 점에 주목할 필요가 있다. 24시간 가동되며 개인의 디지털 삶을 관리하도록 설계된 Gemini Spark(개인용 AI 에이전트)의 등장은 AI가 단순한 도구를 넘어 개인의 비서 역할을 수행하는 시대로의 진입을 가속화한다. 반면, 이러한 범용적 보급은 모델의 작은 판단 오류나 편향성이 대규모 사용자에게 동시다발적으로 영향을 미칠 수 있는 구조적 리스크를 동반하며, 이는 플랫폼 운영사의 관리 부담을 가중시킨다.

자율성 확대에 따른 안전성 확보는 이제 기술적 고도화보다 우선시되는 핵심 과제가 되었다. 구글은 Gemini 3.5를 통해 사이버 보안 및 CBRN(화학·생물·방사능·핵) 관련 안전장치를 대폭 강화했다고 밝혔다. 이는 과거 AI가 민감한 질문에 대해 무조건적으로 답변을 거부하여 사용자의 불편을 초래하던 방식에서 벗어나, 정교하게 조정된 안전 기준에 따라 적절히 대응하도록 설계된 결과다. 주목할 점은 이러한 기술적 보완이 실제 발생한 사회적 리스크에 대한 직접적인 대응책이라는 점이다. 지난해 Gemini와 수주간 대화를 나눈 사용자가 대형 인명 피해 사건을 시도하고 끝내 스스로 목숨을 끊은 사건으로 인해 구글이 소송에 직면한 사례는, 자율 에이전트의 심리적 영향력과 위험성이 이론적 가설이 아닌 실재하는 위협임을 증명한다. 결국 고도화된 자율성은 강력한 안전 가드레일 없이는 치명적인 부작용으로 이어질 수 있다는 사실을 시사한다.