개발자 커뮤니티에서 단순한 코드 생성을 넘어 AI 에이전트가 전체 개발 생명주기를 관리하는 '에이전틱 워크플로우'에 대한 논의가 늘고 있다. 구글은 이번 I/O 2026에서 Antigravity 2.0을 통해 93개의 하위 에이전트가 15,000회 이상의 모델 요청과 26억 개의 토큰을 처리하며 빈 프로젝트에서 운영체제 핵심을 구축하는 과정을 시연했다. 이는 AI의 역할이 단일 함수 작성을 넘어 계획 수립, 실행, 검증, 그리고 배포에 이르는 복잡한 오케스트레이션 단계로 진입했음을 보여준다. 현재 매달 850만 명 이상의 개발자가 구글 모델로 앱을 만들고 있으며, Gemini app의 월간 활성 사용자는 지난해 4억 명에서 9억 명으로 급증했다. 이러한 양적 팽창 속에서 실무자들은 코드 작성 자체보다 검증 비용과 문맥 제공, 런타임 관찰 등이 더 큰 병목으로 작용한다는 점을 관찰하고 있다. 결국 모델의 절대적 지능보다, 모델을 실제 제품과 업무 흐름에 어떻게 배치하고 조율하느냐가 개발 생산성의 새로운 결정 변수가 된 셈이다.

Gemini 3.5 Flash와 Gemma 4, 그리고 9억 명의 사용자 기반

개발팀이 공개한 수치는 사용자 접점의 확장 속도에서 극명하게 갈린다. Gemini 앱의 월간 활성 사용자(MAU)는 지난해 4억 명 수준에서 최근 9억 명 이상으로 급증하며 폭발적인 성장세를 보였다. 이는 단순한 앱 사용량의 증가를 넘어 구글의 AI 생태계가 대중적 임계점을 넘었음을 시사하는 지표로 해석된다. 특히 검색 경험에 깊숙이 통합된 AI Overviews는 월 25억 명, AI Mode는 월 10억 명 이상의 사용자를 확보하고 있다. 이러한 수치는 AI가 더 이상 특정 계층의 실험적 도구가 아니라, 전 세계 수십억 명의 일상적인 정보 탐색과 문제 해결을 담당하는 기본 인터페이스로 완전히 자리 잡았음이 관찰되는 대목이다.

이처럼 거대한 사용자 기반을 안정적으로 지탱하기 위해 구글은 모델의 절대적 성능보다 실행 효율과 비용의 균형을 맞추는 전략을 취한다. Gemini 3.5 Flash는 빠른 실행 속도와 비용 효율성을 핵심 가치로 설계된 API 모델로, 초당 수많은 요청을 처리해야 하는 실제 서비스 환경에서 인프라 운영 비용을 획기적으로 낮추는 핵심 동력으로 작동한다. 여기에 멀티모달 입력과 비디오 출력을 동시에 지원하는 Omni 계열의 첫 모델인 Gemini Omni Flash가 추가되며 기술적 외연을 넓혔다. 이는 텍스트와 이미지를 넘어 비디오라는 고차원 데이터를 실시간으로 처리하고 생성하는 능력이 제품 전반에 이식되는 흐름을 보여주며, 개발자가 구현할 수 있는 사용자 경험의 범위를 비디오 출력이라는 새로운 영역까지 확장시킨다.

클라우드 기반의 폐쇄형 API 모델뿐 아니라 오픈 웨이트 생태계를 통한 개발자 접점 확보 전략 또한 구체적인 수치로 증명된다. Apache 2 라이선스로 제공되는 Gemma 4는 출시 첫 달에만 1억 건의 다운로드를 달성했으며, 전체 누적 다운로드 수는 5억 건을 넘어선 것으로 확인된다. 이는 기업이 데이터 보안이나 지연 시간 문제로 인해 자체 인프라에서 모델을 미세 조정하거나 로컬 환경에 직접 배포하려는 실무적 수요를 정확히 겨냥한 결과로 분석된다. 고성능의 Gemini 라인업이 제공하는 강력한 추론 능력과 Gemma 4가 제공하는 배포의 유연성이 결합하면서, 클라우드와 온디바이스를 유기적으로 오가는 하이브리드 AI 아키텍처를 설계하고 실제 코드에 적용할 수 있는 실무적 토대가 마련된 것으로 제안된다.

Antigravity 2.0과 MCP: '프롬프트'에서 '미션 컨트롤'로의 변화

개발자가 체감하는 가장 큰 변화는 챗봇과의 대화창이 사라지고 독립된 데스크톱 앱인 Antigravity 2.0(안티그래비티 2.0)이 그 자리를 대신한다는 점이다. 기존의 LLM 활용이 단발성 프롬프트 입력과 응답의 반복이었다면, 이제는 작업 리스트를 정의하고 구현 계획을 세우며 변경된 파일을 검토하는 구조적 워크플로우로 전환되었다. 이는 단순한 인터페이스의 변화가 아니라 AI를 도구로 쓰는 방식이 전체 공정을 조망하고 제어하는 미션 컨트롤(Mission Control) 형태로 진화했음을 의미한다.

이 구조의 실질적인 구동 원리는 A2A(Agent-to-Agent, 에이전트 간 협업) 방식의 작업 전달 체계에 있다. 하나의 거대 모델이 모든 과정을 단독으로 처리하는 대신, 특화된 여러 에이전트가 작업을 주고받으며 연쇄적으로 수행한다. 예를 들어 앱 오류를 조사하는 에이전트가 원인이 되는 관련 파일을 찾아내면, 이를 수정하는 에이전트가 코드를 변경하고, 마지막으로 GitHub 커밋을 수행하는 에이전트가 배포 준비를 마치는 식이다. 개발자는 개별 프롬프트를 작성하는 수고를 덜고 에이전트들이 주고받는 작업의 흐름을 관찰하며 최종 결과물을 검토하는 제어권 중심의 환경에서 작업하게 된다.

에이전트가 실제 인프라와 데이터에 정교하게 접근하기 위해 도입된 것이 MCP(Model Context Protocol, 모델 문맥 프로토콜)다. 구글은 50개 이상의 관리형 MCP 서버를 구축하여 에이전트가 Google Cloud 도구와 데이터에 직접 접근할 수 있는 표준화된 경로를 확보했다. 특히 Developer Knowledge MCP는 8~12시간 단위로 최신 문서 스냅샷을 업데이트하여 에이전트에게 제공함으로써, 모델의 지식 컷오프나 오래된 문서로 인해 발생하는 잘못된 코드 생성 문제를 억제한다. 이는 모델의 내부 파라미터에 의존하는 방식에서 벗어나 실시간 외부 지식을 동적으로 주입하는 구조적 해결책으로 관찰된다.

브라우저 단에서의 실행 효율과 접근성을 높이기 위해 Chrome 148 버전부터 제공되는 Chrome Prompt API(크롬 프롬프트 API) 역시 중요한 기술적 축을 담당한다. 브라우저 내에서 모델 호출 인터페이스를 직접 제공함으로써 에이전트가 웹 환경의 런타임 상태를 더 빠르게 파악하고 즉각적으로 대응할 수 있는 기반을 마련했다. 결국 프롬프트라는 좁은 입구를 지나 MCP라는 데이터 파이프라인과 A2A라는 협업 체계가 맞물리며, 개발 환경 자체가 단순한 보조 도구를 넘어 에이전트 중심의 자동화 체계로 재편되는 양상이다.

Android 17과 Firebase SQL Connect가 바꿀 실무 개발 환경

Android 17에서 가장 먼저 바뀌는 지점은 성능 저하 조건의 자동 분석 대상 지정이다. 이전에는 개발자가 프로파일러를 통해 과도한 메모리 사용(excessive memory)이나 콜드 스타트(cold start), 과도한 CPU 점유 같은 성능 병목 지점을 수동으로 추적하고 분석해야 했다. 하지만 이제는 OS 레벨에서 이러한 조건들을 자동 분석 대상으로 지정하여 에이전트가 먼저 문제를 포착하고 보고하는 구조로 변한다. 이러한 변화는 개발자의 일상적인 업무 흐름을 근본적으로 바꾼다. 이제 개발자는 로그를 뒤지며 원인을 찾는 작성자의 역할에서 벗어나, 에이전트가 도출한 분석 결과의 타당성을 검토하고 최종 수정안을 승인하는 검증자의 위치로 이동하게 된다.

Firebase SQL Connect(SQL 기반 앱 개발 지원 도구)는 인프라 계층의 데이터 핸들링 방식을 바꾼다. 특히 custom resolver를 활용해 Cloud Functions나 BigQuery 같은 Google Cloud 서비스를 유연하게 연결할 수 있다는 점이 실무적으로 중요하다. 기존의 데이터 연결 방식이 복잡한 API 호출과 설정의 반복이었다면, 이제는 SQL 기반의 표준화된 방식으로 앱과 클라우드 인프라를 엮어낼 수 있다. 이는 AI 에이전트가 데이터베이스 스키마와 서비스 간의 관계를 더 명확하게 파악하게 함으로써, 인프라 구성 코드를 생성할 때 발생하는 오류를 획기적으로 줄인다. 개발자는 더 이상 연결 설정이라는 반복 작업에 매몰되지 않고, 서비스 간의 데이터 흐름과 비즈니스 로직의 정합성을 설계하는 아키텍처 관점의 작업에 더 많은 시간을 할애하게 된다.

Android Studio Otter와 새 Android CLI는 개발 도구의 비용 효율성을 구체적인 수치로 증명한다. Android Studio Otter는 작업의 경중에 따라 로컬 모델과 원격 모델을 선택적으로 사용하여 토큰 사용량을 최적화하며, 새 Android CLI는 LLM 워크플로우를 직접 지원하여 프로젝트 생성 단계에서 토큰 사용량을 70% 이상 절감하는 성과를 낸다. 여기에 Chrome Modern Web Guidance가 제공하는 100개 이상의 공통 사용 사례 가이드가 더해지면, AI 모델의 지식 컷오프 문제로 인해 낡은 브라우저 호환성 패턴이나 폐기된 API가 코드에 섞여 들어오는 현상을 방지할 수 있다. 에이전트가 최신 Baseline 정보를 바탕으로 구현안을 제시하고 개발자가 이를 검증하는 체계가 안착되면, 최신 웹 표준을 적용하기 위해 매번 공식 문서를 대조하던 수동 검토 과정이 코드 리뷰 단계로 통합되며 개발 속도가 비약적으로 상승한다.