72%. OSWorld(컴퓨터 사용 작업 벤치마크)에서 인간이 복잡한 PC 조작 과제를 완수하는 정답률이다. AI가 아무리 화려한 언변을 자랑해도, 실제 운영체제 위에서 마우스를 움직이고 클릭하는 '실행 능력'은 아직 숙련된 인간의 수준에 한참 못 미친다는 뜻이다. 그런데 구글은 이 실행의 벽을 넘기 위해 단순한 챗봇을 넘어 사용자가 잠든 사이에도 스스로 일하는 자율 에이전트 Gemini Spark를 꺼내 들었다.
지금 개발자 커뮤니티는 '단순히 답하는 AI'에서 '대신 해주는 AI'로의 전환점에 서 있다. 구글이 이번 Google I/O 2026에서 공개한 Gemini Spark는 노트북을 닫고 스마트폰을 잠가둬도 클라우드에서 24시간 내내 작동한다. 이메일을 초안하고, 문서를 조립하며, 인박스를 모니터링하는 것은 물론 최종적으로는 사용자를 대신해 돈을 쓰는 단계까지 설계됐다. 이는 AI가 더 이상 사용자의 프롬프트를 기다리는 수동적 도구가 아니라, 백그라운드에서 끊임없이 워크플로우를 처리하는 '디지털 직원'으로 진화했음을 의미한다.
Gemini Spark의 24시간 자율 작동과 AP2 결제 시스템
지금까지의 AI 비서는 사용자가 프롬프트를 입력하는 순간에만 반응하는 수동적인 도구였다. 하지만 구글이 Google I/O 2026에서 공개한 Gemini Spark는 사용자의 노트북이 닫혀 있고 스마트폰이 잠긴 상태에서도 구글 클라우드 인프라에서 24시간 내내 자율적으로 작동한다. 이 에이전트는 단순히 질문에 답하는 수준을 넘어 이메일 초안 작성, 문서 조립, 인박스 모니터링과 같은 복잡한 업무를 스스로 처리한다. 예를 들어 공유 스프레드시트의 최신 수치와 슬라이드 덱의 프로젝트 일정을 취합해 상사에게 보고 이메일을 보내는 식의 다단계 워크플로우를 인간의 추가 개입 없이 완결한다. 이번 주 신뢰할 수 있는 테스터 그룹을 시작으로 다음 주에는 미국 내 Google AI Ultra 구독자를 대상으로 베타 서비스가 제공된다.
개발자 커뮤니티에서 가장 뜨겁게 논의되는 지점은 AI에게 결제 권한을 부여하는 방식이다. 구글은 이를 해결하기 위해 AP2(Agent Payments Protocol, AI 에이전트 전용 보안 결제 프로토콜)를 제시했다. 사용자가 허용하는 특정 브랜드와 제품, 지출 한도를 미리 설정하면 에이전트가 그 범위 내에서 보안 결제를 수행하는 구조다. 특히 개인정보 보호 기술과 조작 불가능한 디지털 권한 부여 방식을 통해 사용자와 상점, 결제 프로세서 사이의 투명한 연결 고리를 생성한다. 모든 거래 과정은 영구적인 디지털 기록으로 남기 때문에 반품이나 환불 시에도 명확한 근거를 확보할 수 있다. 이러한 체계는 구글이 올해 초 발표한 UCP(Universal Commerce Protocol, 에이전트-커머스 공통 언어 오픈소스 표준)를 기반으로 한다. 아마존, 메타, 마이크로소프트, 세일즈포스, 스트라이프가 참여한 이 오픈소스 표준은 에이전트와 커머스 시스템이 쇼핑 전 과정에서 소통할 수 있는 공통 언어를 제공한다.
실제 구매 경험을 통합하는 Universal Cart(여러 상점과 구글 서비스에서 통합 작동하는 지능형 쇼핑카트)의 등장도 주목할 만하다. 사용자는 구글 검색이나 유튜브, 지메일을 이용하다가 발견한 상품을 하나의 지능형 카트에 담을 수 있다. 이 카트는 백그라운드에서 작동하며 실시간으로 가격 하락을 추적하고 사용자의 결제 카드 혜택에 기반한 최적의 딜을 찾아낸다. 심지어 구매하려는 제품 간의 호환성 문제를 사전에 감지해 사용자에게 알리는 기능까지 포함됐다. 이 쇼핑 인프라는 이번 여름 미국 내 구글 검색과 제미나이 앱에 먼저 적용되며, 이후 유튜브와 지메일로 확대될 예정이다. 이는 AI가 단순한 정보 제공자를 넘어 실제 경제 활동의 주체로 진입하는 구체적인 경로를 보여준다.
클라우드 상주형 아키텍처와 MCP 기반의 확장성
구글 스파크의 핵심은 사용자가 노트북을 닫고 스마트폰을 잠가도 작업이 멈추지 않는다는 점이다. Gemini 3.5 Flash 모델과 구글 내부 개발 도구 기반의 Antigravity agent harness(안티그래비티 에이전트 하네스)를 통해 구글 클라우드 인프라에서 상주형으로 구동된다. 개발자들 사이에서는 단순한 챗봇을 넘어 서버 사이드에서 24시간 돌아가는 진정한 의미의 백그라운드 워커가 등장했다는 반응이 뜨겁다. 기기 상태와 상관없이 작업이 지속되는 구조는 에이전트가 단순한 비서가 아니라 독립적인 수행 주체로 진화했음을 보여준다.
경쟁사들의 접근 방식은 여기서 극명하게 갈린다. OpenAI의 ChatGPT agent(챗GPT 에이전트)는 자체 가상 컴퓨터 방식을 채택해 웹사이트 상호작용과 정보 합성을 처리한다. 하지만 OSWorld(OS월드) 벤치마크에서 38.1%라는 점수를 기록하며 실제 작업 수행의 신뢰성 문제로 커뮤니티의 날 선 비판을 받았다. Anthropic(앤스로픽)의 Claude Computer Use Agent(클로드 컴퓨터 유즈 에이전트)는 사용자의 데스크톱을 직접 제어하고 로컬 파일을 조작하는 방식에 집중한다. 개발 커뮤니티에서는 내 기기의 제어권을 직접 넘겨줘야 하는 로컬 제어 방식보다 클라우드 인프라에서 독립적으로 수행되는 상주형 아키텍처가 보안과 리소스 관리 측면에서 훨씬 현실적인 대안이라는 논쟁이 치열하게 전개되고 있다.
확장성 전략은 MCP(Model Context Protocol, 모델 컨텍스트 프로토콜)를 통해 구체화된다. Canva(캔바), OpenTable(오픈테이블), Instacart(인스타카트)를 포함한 30개 이상의 서드파티 파트너를 연결해 에이전트의 활동 범위를 외부 서비스로 빠르게 넓혔다. 이는 에이전트가 구글 생태계라는 성벽을 넘어 외부 API와 유기적으로 결합하는 표준을 제시한 것으로 평가받는다. 여기에 Android Halo(안드로이드 헤일로)라는 인터페이스를 더해 스파크가 현재 어떤 작업을 수행하고 있는지 안드로이드 화면 상단에서 실시간으로 확인할 수 있게 했다. 사용자가 명령을 내린 뒤 결과가 나올 때까지 기다리는 것이 아니라 작업 과정을 실시간으로 모니터링하는 경험으로 전환하며 에이전트의 블랙박스 문제를 해결하려는 시도다.
AI 에이전트의 상용화와 신뢰의 임계점
학생이 학습 가이드를 만들라고 지시하면 새로운 과제가 추가될 때마다 스스로 내용을 업데이트하고, 소상공인은 수신함을 모니터링하며 고객 문의를 분류하며, 학부모는 행사 물류를 조정하며 RSVP를 추적한다. 이는 사용자가 프롬프트를 입력하고 응답을 기다리는 기존의 상호작용 방식이 아니라, 클라우드 인프라 위에서 백그라운드로 끊임없이 작동하는 자율 워크플로우로의 전환이다. 개발자 커뮤니티에서는 이제 응답의 정확도보다 에이전트에게 어디까지 제어권을 넘길 것인가 하는 권한 위임의 문제로 논의의 중심이 옮겨가고 있다. 조쉬 우드워드 부사장이 묘사한 것처럼 사용자가 어깨 너머로 할 일을 던지면 에이전트가 이를 낚아채 처리하는 경험은 업무 패러다임 자체를 바꾸는 지점이다.
하지만 자율 결제 권한이 부여되는 순간 보안에 대한 우려가 폭발하며 신뢰의 임계점 문제가 수면 위로 떠오른다. 내 지갑을 가진 AI가 사용자의 의도를 오해해 엉뚱한 곳에 돈을 썼을 때의 리스크는 개발자와 사용자 모두에게 가장 뜨거운 논쟁거리다. 구글은 이 상황을 틴에이저에게 첫 데빗 카드를 주는 것에 비유하며, 무제한의 자유가 아닌 엄격한 한도와 제약 설정을 통해 신뢰 모델을 구축하겠다고 밝혔다. 초기 단계에서는 AI가 독단적으로 거래를 완료하지 않고 사용자가 명시적으로 검토하고 승인하는 프로세스를 거치게 된다. 실무자들 사이에서는 이러한 인간의 개입(Human-in-the-loop)이 효율성을 저해할 수 있다는 의견과, 보안 사고를 막기 위한 최소한의 안전장치라는 의견이 팽팽하게 맞서고 있다.
이러한 불신을 기술적으로 해결하기 위해 도입된 것이 AP2(Agent Payments Protocol, 에이전트 결제 프로토콜)다. 사용자가 허용하는 특정 브랜드와 제품, 그리고 지출 한도를 미리 설정하면 에이전트가 그 경계 내에서만 보안 결제를 수행하는 구조다. 특히 개인정보 보호 기술과 조작 불가능한 디지털 권한 부여 방식을 통해 사용자, 가맹점, 결제 프로세서 사이에 투명하고 검증 가능한 연결 고리를 만든다. 모든 거래는 영구적인 디지털 기록으로 남겨 반품이나 분쟁 시 사용자와 가맹점이 동일한 레코드를 확인하도록 설계되었다. 주목할 점은 유니버설 커머스 프로토콜(UCP, 범용 커머스 프로토콜) 기술 위원회에 아마존, 메타, 마이크로소프트, 세일즈포스, 스트라이프가 이름을 올렸다는 사실이다. 경쟁 관계인 빅테크들이 에이전트 상거래를 위한 공통 언어 표준화에 합의했다는 것은, AI 에이전트가 가져올 경제적 파급력이 개별 기업의 이익보다 크다는 판단이 섰음을 보여준다.




