햇살이 내리쬐는 오후, 샌프란시스코 마운틴뷰의 쇼어라인 앰피시어터.

수만 명의 개발자가 데모존에 모여 AI 안경을 쓰고 가상 세계가 구현되는 화면을 응시한다.

화면 속 텍스트에 머물던 AI가 사용자의 시야와 일상 공간으로 튀어나오는 장면이다.

이런 풍경이 이제는 일상이 된다.

제미나이 3.5와 4종의 신규 AI 솔루션 공개

구글은 연산 효율이 2배 향상된 제미나이 3.5(Gemini 3.5)를 기반으로 4가지 신규 솔루션을 공개했다. 이번 발표는 AI 지능을 벤치마크 점수가 아닌 창작과 문서 작업이라는 실무 영역에 직접 적용하는 데 집중했다.

가장 먼저 공개된 프로젝트 지니(Project Genie)는 텍스트나 이미지 입력을 통해 가상 세계를 즉각적으로 구축한다. 영상 처리 도구인 제미나이 옴니(Gemini Omni)는 일반 화질의 영상을 할리우드 영화 수준의 컴퓨터 그래픽(CG) 품질로 변환해 개인 창작자의 고품질 콘텐츠 생산을 돕는다.

문서 작업 도구인 닥스 라이브(Docs Live)는 음성 명령만으로 내용을 실시간 정리하고 구조화한다. 마지막으로 인텔리전트 아이웨어(Intelligent Eyewear)는 AI 기능을 내장한 스마트 안경으로, 시각 정보를 실시간 분석해 사용자 시야 내에 데이터를 제공함으로써 모바일 기기 없는 AI 상호작용 인터페이스를 구현했다.

텍스트 생성에서 가상 세계와 웨어러블로의 확장

AI 인터페이스가 키보드와 화면을 벗어나 음성과 시각으로 확장된다. 닥스 라이브를 통해 사용자는 텍스트 입력 대신 음성만으로 문서의 목차를 잡고 세부 내용을 정리할 수 있게 됐다.

시각적 경험 역시 정지된 이미지 생성에서 상호작용 가능한 환경 구축으로 진화했다. 프로젝트 지니는 사용자가 상상한 요소를 조합해 움직이는 가상 세계를 만들며, 제미나이 옴니는 전문 스튜디오의 복잡한 렌더링 과정 없이 일반 영상을 고품질 CG로 변환해 제작 공정을 단순화한다.

특히 인텔리전트 아이웨어는 AI 실행 경로를 스마트폰 앱에서 웨어러블 기기로 옮겼다. 사용자의 시야에 들어오는 실시간 정보와 제미나이의 응답이 안경 렌즈에서 직접 결합하며, AI가 특정 앱의 기능이 아닌 사용자의 감각 기관과 결합한 기본 인터페이스로 작동한다.

AI 하드웨어 시장 진입과 콘텐츠 생산 비용의 하락

인텔리전트 아이웨어의 보급은 AI를 주변에 항상 존재하는 앰비언트 AI(Ambient AI) 환경으로 만든다. 사용자가 보는 모든 시각 정보가 실시간 입력값이 되어 즉각적인 피드백을 제공하며, 이는 AI 상용화 지점이 소프트웨어에서 웨어러블 하드웨어로 이동했음을 의미한다.

콘텐츠 생산 비용의 구조적 변화도 일어난다. 제미나이 옴니를 활용하면 과거 수억 원의 예산과 전문 인력이 필요했던 고품질 영상 구현이 AI 도구 하나로 가능해진다. 이로 인해 영상 콘텐츠의 경쟁력은 자본력보다 아이디어의 구체성에 의해 결정된다.

사무 생산성 측면에서는 닥스 라이브가 음성 기반 입력 체계를 구축해 문서 작성에 소요되는 물리적 시간을 단축하고, 사용자가 도구 사용법을 익혀야 하는 학습 비용을 제거했다.

구글 글로벌 커뮤니케이션 임원진은 AI가 인간의 감각과 행동 양식에 직접 결합되는 단계에 진입했음을 강조했다. 구글은 전용 하드웨어와 생성 도구를 통해 AI가 일상에 스며드는 물리적 접점을 확보했다.

제미나이 3.5와 AI 안경의 결합은 구글의 접점을 검색창 밖으로 확장한다. 구글은 웨어러블 기기를 통해 사용자 데이터를 직접 수집하는 경로를 소유하고, 이를 새로운 OS 진입로로 활용하려는 전략을 택했다. 이제 검색은 입력하는 행위가 아니라 보는 행위로 바뀌며, 이러한 인터페이스의 변화가 검색 시장의 수익 구조를 결정하게 된다.

제미나이 3.5와 AI 안경의 결합은 구글의 접점을 검색창 밖으로 확장한다. 사용자는 이제 화면을 켜지 않고 시각 정보와 실시간으로 상호작용한다. 구글은 모델의 고도화를 넘어 데이터를 수집하는 물리적 경로를 직접 소유하려는 전략을 택했다. 웨어러블 기기는 단순한 액세서리가 아니라 새로운 OS 진입로가 된다. 하드웨어와 AI 모델의 결합은 사용자 경험의 주도권을 앱에서 환경으로 옮긴다. 이제 검색은 입력하는 행위가 아니라 보는 행위로 바뀐다. 인터페이스의 변화가 검색 시장의 수익 구조를 결정한다.