스마트폰 화면 속 인공지능 앱의 순위가 요동치고 있다. 과거에는 챗봇의 대화 능력이 개선되거나 음성 대화 인터페이스가 추가될 때 사용자가 몰렸지만, 지금은 상황이 다르다. 최근 앱 인텔리전스 기업 앱피규어스(Appfigures, 앱 시장 데이터를 분석하는 도구)의 보고서에 따르면, 이미지 생성 모델의 등장이 앱 다운로드 지형을 완전히 바꾸어 놓았다. 텍스트 중심의 모델 업데이트보다 이미지 관련 기능이 탑재될 때 앱 설치율이 6.5배 더 높게 나타나는 현상이 관찰된다.
이미지 모델 출시가 가져온 2,200만 건의 다운로드
구체적인 수치는 시장의 변화를 증명한다. Google의 Gemini는 지난해 8월 Gemini 2.5 Flash 이미지 모델을 공개한 이후 28일 동안 2,200만 건 이상의 추가 다운로드를 기록했다. 이는 해당 기간 앱 전체 다운로드 수치를 이전 대비 4배 이상 끌어올린 결과다. OpenAI의 ChatGPT 역시 지난해 3월 GPT-4o 이미지 모델을 선보인 직후 28일 동안 1,200만 건 이상의 신규 설치를 확보했다. 이는 GPT-4o, GPT-4.5, GPT-5 등 기존 텍스트 중심 모델 업데이트 당시와 비교했을 때 약 4.5배 높은 수치다. Meta AI가 9월에 공개한 AI 비디오 피드 바이브스(Vibes, 영상 생성 및 시각 콘텐츠를 제공하는 기능) 역시 28일 만에 260만 건의 추가 다운로드를 유도하며 시각적 콘텐츠가 사용자 유입의 핵심 동력임을 입증했다.
텍스트 중심의 챗봇에서 시각적 경험으로의 전환
예전에는 사용자가 챗봇의 지능적 답변이나 대화의 자연스러움에 반응했다면, 이제는 눈으로 즉각 확인할 수 있는 결과물이 앱 선택의 기준이 되었다. 딥시크(DeepSeek, 저비용 고효율 학습 기법으로 주목받은 AI 모델)의 사례는 이 흐름에서 다소 예외적인 지점을 보여준다. 딥시크 R1(DeepSeek R1, 추론 능력을 강화한 대규모 언어 모델)은 이미지 모델이 아님에도 1월 출시 이후 2,800만 건의 다운로드를 기록했다. 이는 기술적 호기심과 비용 효율성에 대한 시장의 관심이 폭발하며 나타난 이례적인 현상이다. 하지만 일반적인 앱 시장의 패턴은 텍스트의 논리적 우위보다 이미지 생성이라는 시각적 효용성에 더 크게 반응하고 있다.
다운로드와 수익 사이의 간극
개발자가 체감하는 변화는 단순히 설치 수치에 머물지 않는다. 다운로드가 곧바로 매출로 이어지는 것은 아니다. Google의 나노 바나나(Nano Banana, Gemini의 이미지 생성 모델)는 출시 직후 28일간 18만 1천 달러의 매출을 기록하는 데 그쳤다. 반면 OpenAI의 GPT-4o 이미지 모델은 같은 기간 7천만 달러의 매출을 창출하며 압도적인 수익화 능력을 보여주었다. Meta AI의 바이브스 역시 다운로드는 늘렸으나 유의미한 수익 창출에는 실패했다. 사용자는 시각적 기능을 확인하기 위해 앱을 설치하지만, 그 기능을 지속적으로 사용하고 비용을 지불하게 만드는 것은 결국 모델의 완성도와 생태계의 결합력이다.
결국 사용자의 선택은 기술의 복잡함이 아닌 시각적 즉각성에 쏠려 있으며, 이제 AI 앱의 성패는 모델의 지능을 얼마나 매력적인 시각 경험으로 치환하느냐에 달려 있다.




