판교의 한 1인 기업 사무실. 모니터에는 디자인 툴의 복잡한 레이어 창과 수정되지 않는 AI 생성 이미지가 띄워져 있다. 소셜 미디어에 올릴 마케팅 자료를 만들던 사용자는 이미지의 작은 디테일 하나를 바꾸기 위해 다시 프롬프트를 입력하지만, AI는 엉뚱하게 배경 전체를 바꿔버린다. 결국 사용자는 한숨을 쉬며 처음부터 다시 작업을 시작한다.

이런 비효율은 현재 AI 이미지 생성 모델들이 가진 고질적인 한계다. 고품질의 이미지를 만들어낼 수는 있지만, 특정 부분만 정밀하게 수정하는 것은 여전히 어렵다. 사용자는 완벽에 가까운 결과물을 얻고도 작은 오타 하나 때문에 전체를 포기하거나, 숙련된 편집 도구를 배워야만 했다.

이 장면 뒤에 Google이 준비한 새로운 해법이 등장한다. Google은 최근 I/O 행사에서 디자인 숙련도와 상관없이 누구나 쉽게 시각 자료를 만들고 수정할 수 있는 환경을 제시했다.

Google I/O 2026에서 발표된 'Pics'와 Nano Banana 2

디자인 숙련도가 낮은 사용자가 텍스트 프롬프트만으로 소셜 미디어 그래픽이나 마케팅 자료를 만드는 과정이 구글 워크스페이스 내부로 들어왔다. 구글은 I/O 2026에서 워크스페이스용 AI 디자인 및 이미지 생성 앱인 픽스(Pics, 구글 워크스페이스용 AI 디자인 및 이미지 생성 앱)를 발표했다. 교사나 소규모 사업자처럼 전문 디자인 도구 활용이 어려운 계층을 타겟으로 설정해 진입장벽을 낮춘 것이 특징이다. 이는 캔바(Canva)와 같은 기존 디자인 플랫폼은 물론 앤스로픽(Anthropic)의 클로드 디자인(Claude Design)과 같은 AI 네이티브 경쟁 모델을 정조준한 행보다. 시각적 콘텐츠 생산 능력이 비즈니스의 핵심 경쟁력이 된 시점에서 구글은 자사 생태계 내에 디자인 도구를 내재화함으로써 사용자의 이탈을 막고 생산성을 높이는 전략을 택했다.

픽스의 구동 핵심은 나노 바나나 2(Nano Banana 2) 모델이다. 구글은 이 모델이 정밀한 텍스트 렌더링과 실세계 지식, 그리고 상세한 시각적 출력을 지원한다는 점을 강조했다. 기존 AI 이미지 생성 모델들이 이미지 내 텍스트를 부정확하게 표기하거나 세부 묘사에서 왜곡을 일으켰던 기술적 한계를 극복하려는 시도다. 특히 텍스트 렌더링의 정밀도는 초대장이나 마케팅 목업과 같이 정확한 정보 전달이 필수적인 디자인 작업에서 결과물의 완성도를 결정짓는 핵심 요소가 된다. 나노 바나나 2는 이러한 요구사항을 충족함으로써 단순한 예술적 생성물을 넘어 실제 비즈니스 환경에서 즉시 투입 가능한 수준의 시각 자료를 도출하는 데 최적화되었다.

주목할 점은 생성 이후의 편집 제어권이다. 기존 AI 모델들은 이미지의 일부만 수정하려 해도 전체 프롬프트를 다시 작성해야 했으며, 이 과정에서 원치 않는 부분까지 함께 변형되는 문제가 빈번했다. 반면 픽스는 제미나이(Gemini)가 편집 레이어를 담당하여 생성된 디자인의 모든 요소를 개별적으로 조정할 수 있게 설계했다. 사용자는 수정하고 싶은 부분을 클릭해 구글 문서(Google Docs)에서 피드백을 남기듯 코멘트를 작성하거나, 새로운 프롬프트를 입력해 변경 사항을 반영할 수 있다. 또한 코멘트나 프롬프트 없이도 직접 텍스트를 수정하는 수동 편집이 가능하다. 예를 들어 생일 파티 초대장에 기입된 시간을 직접 클릭해 수정하는 방식은 AI의 무작위성을 배제하고 사용자의 의도를 정확히 반영한다.

픽스는 구글 워크스페이스에 네이티브하게 구축되어 앱 간 시각적 협업이 가능하다. 완성된 디자인은 다운로드, 복사, 인쇄, 공유가 가능하며 최종 배포 전 다른 작업자에게 전달해 수정 보완하는 협업 워크플로우를 지원한다. 출시 일정은 I/O 테스터들에게 우선 공개된 이후 올여름 구글 AI 울트라(Google AI Ultra) 구독자에게 확대 제공될 예정이다.

Gemini 기반 편집 레이어와 요소별 제어 방식

기존의 AI 이미지 생성 도구들은 결과물의 일부만 수정하려 해도 전체 프롬프트를 다시 작성해야 하는 구조적 제약이 있었다. 작은 디테일 하나를 바꾸기 위해 운에 맡겨 다시 생성하는 과정은 실무 디자인 작업에서 효율을 떨어뜨리는 결정적인 요인이었다. 반면 이번에 공개된 Pics는 Gemini를 기반으로 한 편집 레이어 구조를 도입해 이 문제를 정면으로 해결했다. 생성된 디자인 내의 모든 요소를 개별적인 객체로 인식하여 사용자가 원하는 부분만 정밀하게 조정할 수 있도록 설계한 것이다. 이는 결과물을 단순한 픽셀의 집합이 아니라 수정 가능한 레이어들의 체계로 제공한다는 점에서 기존의 생성형 AI 모델들이 가졌던 한계를 극복한 시도로 분석된다.

구체적인 수정 방식은 Google Docs(구글 문서)의 협업 인터페이스와 매우 유사한 메커니즘으로 작동한다. 사용자는 디자인 내에서 수정이 필요한 특정 요소를 마우스로 클릭한 뒤, 댓글 형태로 구체적인 수정 요청을 남길 수 있다. 전체 이미지를 처음부터 다시 생성할 필요 없이 특정 영역에 대해서만 Gemini에게 변경 지시를 내리는 방식이다. 이러한 방식은 사용자가 의도한 변경 사항을 AI에게 정확하게 전달할 수 있게 하며, 불필요한 재생성 횟수를 줄여 작업 시간을 단축시킨다. 그러나 이러한 간접적인 요청 방식 외에도 사용자의 즉각적인 제어권을 보장하는 수동 수정 장치를 함께 마련했다.

텍스트 수정의 경우 AI의 생성 능력에 전적으로 의존하지 않고 사용자가 직접 수동으로 내용을 변경할 수 있는 권한을 부여했다. 예를 들어 생일 파티 초대장을 생성했을 때 카드에 기재된 행사 시간을 수정해야 한다면, 프롬프트를 다시 입력해 AI가 시간을 맞게 적어주길 기다리는 대신 해당 텍스트 영역을 직접 클릭해 내용을 수정하는 방식이다. 주목할 점은 AI가 생성한 시각적 요소와 사용자가 직접 입력하는 텍스트 데이터가 동일한 편집 레이어 상에서 유연하게 상호작용한다는 사실이다. 이는 AI 디자인 도구가 단순한 생성 도구를 넘어 실질적인 편집 툴로서의 기능을 수행하게 함을 의미한다.

전체적인 작업 흐름은 프롬프트 입력에서 시작해 최종 출력까지 유기적인 단계로 이어진다. 사용자가 텍스트 프롬프트를 입력하면 시스템이 이미지를 생성하고, 이후 편집 레이어를 통해 세부적인 부분 수정을 거치는 프로세스로 구성된다. 수정이 완료된 최종 결과물은 다운로드하거나 복사할 수 있으며, 인쇄 또는 공유 기능을 통해 즉시 외부로 전달 가능하다. 특히 Google Workspace(구글 워크스페이스, 구글의 협업 도구 모음)에 네이티브하게 통합되어 있어, 최종 배포 전 다른 작업자에게 결과물을 전달해 마지막 수정 단계를 거치는 협업 워크플로우까지 지원하며 실무 적용 가능성을 높였다.

캔바(Canva)와 Claude Design을 겨냥한 시장 재편

교사와 소규모 사업자 등 디자인 비전문가들은 전문 편집 도구보다 진입장벽이 낮은 단순한 툴을 선호한다. 구글은 픽스(Pics, AI 기반 디자인 및 이미지 생성 앱)를 통해 이러한 사용자층을 직접 겨냥한다. 기존 AI 디자인 시장의 경쟁이 단순히 고품질 이미지를 만들어내는 생성 능력에 집중했다면, 구글의 전략은 이를 편집하고 협업하는 프로세스로 이동시킨다. 이는 생성된 이미지가 실제 업무에 활용되기까지 거쳐야 하는 수정 단계의 병목 현상을 해결하려는 시도다. 특히 프롬프트 수정만으로 세부 요소를 변경해야 했던 기존의 불확실성을 제거하고, 직관적인 제어권을 사용자에게 부여하는 데 초점을 맞췄다.

반면 캔바(Canva, 온라인 디자인 플랫폼)나 앤스로픽(Anthropic)의 클로드 디자인(Claude Design, AI 네이티브 디자인 도구)은 이미 강력한 사용자 기반과 템플릿 생태계를 보유하고 있다. 그러나 구글은 구글 워크스페이스(Google Workspace, 클라우드 기반 협업 도구 모음)와의 네이티브 통합이라는 전략적 이점을 활용한다. 별도의 플랫폼으로 이동할 필요 없이 문서 작성이나 이메일 발송 과정에서 즉시 시각 자료를 생성하고 편집할 수 있는 환경을 제공하는 것이다. 이는 도구 간 전환 비용을 최소화하여 사용자 락인 효과를 극대화하는 전략이며, 단순한 앱의 추가가 아니라 업무 환경 자체를 디자인 스튜디오로 확장하는 접근이다.

주목할 점은 시각적 협업의 구현 방식이다. 구글 문서에서 피드백을 주고받는 것처럼 이미지의 특정 요소에 댓글을 남겨 수정을 요청하는 기능은 단순한 이미지 생성을 넘어선 워크플로우의 통합을 의미한다. 실무자 입장에서 AI가 생성한 결과물이 90% 수준으로 만족스럽더라도 나머지 10%를 수정하기 위해 다시 프롬프트를 입력해야 했던 기존의 불편함을 제거한 것이다. 사용자가 직접 수동 편집을 수행하거나 AI에게 구체적인 수정 지시를 내리는 하이브리드 방식은 최종 결과물을 도출하는 시간을 단축시킨다. 생성된 디자인을 즉시 다운로드하거나 공유하고, 다른 협업자에게 최종 편집을 요청하는 일련의 과정은 기업의 콘텐츠 생산 사이클을 가속화한다.

결과적으로 시각적 콘텐츠 의존도가 높은 현대 비즈니스 환경에서 AI 디자인은 단순한 부가 기능이 아닌 핵심 경쟁 영역으로 부상했다. 이제 시장의 승부처는 누가 더 화려한 이미지를 만드느냐가 아니라, 누가 더 빠르게 비즈니스 요구사항에 맞는 최종 결과물을 도출하느냐로 옮겨가고 있다. AI 네이티브 도구들이 개별 기능의 고도화에 집중하는 사이, 구글은 협업 생태계라는 인프라를 통해 디자인 시장의 주도권을 재편하려는 움직임을 보이고 있다. 이는 디자인 숙련도와 관계없이 누구나 기업 수준의 시각 자료를 생산할 수 있는 환경을 구축함으로써 AI 디자인의 대중화 단계를 생성에서 운용의 단계로 격상시키는 결과로 이어진다.