60%.
스포티파이가 전년 대비 기록한 오디오북 청취 시간의 성장률이다.
단순한 수치 상승을 넘어 이용자의 콘텐츠 소비 습관이 텍스트에서 오디오로 빠르게 전이되고 있음을 의미한다.
그리고 스포티파이는 이 가속도에 불을 붙이기 위해 콘텐츠 생산의 가장 큰 병목 구간인 '제작' 단계에 AI를 투입하기로 했다.
이번에 공개한 ElevenLabs(생성형 AI 보이스 스타트업) 기반의 오디오북 제작 도구는 'Spotify for Authors' 플랫폼의 핵심 기능으로 탑재된다. 단순히 유통망을 제공하던 플랫폼에서 AI를 통해 콘텐츠 생산 도구까지 제공하는 '풀스택 오디오 생태계'로 진화하겠다는 포석이다. 특히 작가들에게 비독점적 계약 조건을 제시하며 진입 장벽을 낮춘 점이 눈에 띈다. 이는 더 많은 롱테일 콘텐츠를 빠르게 확보해 시장 점유율을 굳히려는 전략적 선택이다.
6월 베타 출시되는 ElevenLabs 기반 오디오북 제작 툴
스포티파이가 ElevenLabs(일레븐랩스, AI 음성 합성 스타트업) 기반의 오디오북 제작 도구를 선보인다. 이번 도구는 Spotify for Authors(스포티파이 저자 플랫폼) 내에 직접 탑재되는 형태다. 6월부터 초대 기반의 베타 서비스로 운영을 시작한다. 초기 지원 언어는 영어로 한정하여 기술적 안정성을 먼저 검증한다. 기존에는 외부 플랫폼에서 제작한 파일을 제출하는 방식이었으나 이제는 플랫폼 내에서 생성과 출판이 한 번에 이루어진다.
작가들에게 적용되는 계약 조건은 비독점적 출판 방식이다. 생성된 오디오북을 타 플랫폼에 동시에 배포하는 것을 허용한다. 이는 작가의 심리적 진입 장벽을 낮춰 콘텐츠 공급량을 빠르게 늘리려는 전략적 포석이다. 스포티파이는 이미 구글 플레이 북스와의 파트너십을 통해 디지털 낭독 콘텐츠를 공급받고 있다. 하지만 더 인간에 가까운 표현력과 감정을 담은 최신 음성 모델을 직접 제공함으로써 공급망의 주도권을 확보하려는 계산이다. 외부 솔루션에 의존하던 구조를 내재화하여 제작 효율을 극대화하는 지형 변화를 꾀하고 있다.
서비스 확장 지형은 글로벌 시장으로 빠르게 넓어진다. Spotify for Authors 플랫폼은 10개 언어로 지원 범위를 대폭 확대한다. 프랑스어와 독일어, 네덜란드어, 스웨덴어, 핀란드어, 아이슬란드어, 덴마크어, 노르웨이어가 포함된다. 여기에 캐나다 프랑스어와 라틴아메리카 스페인어까지 추가하여 북미와 유럽 시장의 세부 언어권까지 공략한다. 이는 단순한 도구 제공을 넘어 다국어 오디오북 생태계를 직접 구축해 글로벌 점유율을 높이려는 의도다. 언어 장벽을 AI로 허물어 콘텐츠의 생산과 소비 주기를 단축시키는 구조다.
수익 모델의 고도화와 사용자 경험 확장도 동시에 진행한다. Audiobook+(오디오북 플러스, 스포티파이의 오디오북 유료 플랜)의 청취 한도를 상향 조정해 사용자 만족도를 높인다. 향후 학생과 가족을 위한 전용 옵션을 추가해 신규 구독자 층을 확장할 계획이다. 구체적인 가격 체계나 세부 이용 조건은 이번 발표에서 명시되지 않았다. 하지만 청취 한도 확대는 유료 구독자의 플랫폼 체류 시간을 늘려 락인(Lock-in, 고객 이탈 방지) 효과를 극대화하려는 비즈니스 임팩트를 노린 것이다. 콘텐츠 공급의 내재화와 소비 한도의 확장을 통해 오디오북 사업의 수익성을 끌어올리려는 전략이다.
구글 플레이 북스에서 ElevenLabs로, '표현력'의 전환
스포티파이는 기존에 구글 플레이 북스(Google Play Books, 구글의 전자책 및 오디오북 서비스)와 파트너십을 맺고 디지털 낭독 콘텐츠를 제공해 왔다. 이는 텍스트를 음성으로 변환하는 기본적인 디지털 낭독 방식에 의존한 구조였다. 당시의 기술적 지향점은 텍스트의 정확한 전달과 효율적인 변환에 머물렀다. 디지털 낭독은 비용 효율적이었으나 청취자의 몰입을 끌어내는 데는 분명한 한계가 있었다. 시장의 기준은 단순한 정보 전달에서 감정적 몰입으로 빠르게 이동했다. 청취자는 기계적인 낭독보다 인간의 호흡과 미세한 뉘앙스가 담긴 목소리를 원하기 시작했다.
이 지점에서 일레븐랩스(ElevenLabs, 생성형 AI 기반 음성 합성 스타트업)의 기술력이 투입된다. 일레븐랩스는 2025년 작가들을 위한 자체 자가 출판 플랫폼을 출시하며 오디오북 생산의 진입 장벽을 획기적으로 낮췄다. 이들이 제공하는 최신 AI 보이스 모델은 기존의 디지털 낭독과는 궤를 달리한다. 단순한 음절의 조합이 아니라 문맥을 이해하고 상황에 맞는 감정을 실어 읽는 표현력이 핵심이다. 인간에 가까운(human-like) 음성 구현은 오디오북의 품질 기준 자체를 상향 평준화하며 청각적 경험의 수준을 한 단계 끌어올렸다.
전략적 포석은 명확하다. 구글 플레이 북스와의 협력이 콘텐츠 수급을 위한 유통망 확보에 치중했다면, 일레븐랩스와의 결합은 생산 도구의 고도화에 집중한 선택이다. 작가들이 더 정교한 AI 도구를 통해 고품질의 오디오북을 직접 제작하고 이를 스포티파이 생태계에 빠르게 공급하게 만든다. 이는 단순한 파트너 교체가 아니라 오디오북 제작 지형의 근본적인 변화다. 고비용의 성우 녹음 과정 없이도 상업적 경쟁력을 갖춘 콘텐츠 생산이 가능해지는 구조를 구축한 것이다.
이러한 전환은 콘텐츠 공급망의 효율성을 극대화하는 장치가 된다. 과거에는 디지털 낭독의 낮은 품질 때문에 전문 성우를 고용하거나 품질 저하를 감수해야 하는 이분법적 선택지뿐이었다. 이제는 AI 보이스의 표현력이 인간의 영역을 정교하게 대체하며 그 간극을 메운다. 스포티파이는 이를 통해 더 많은 독립 작가들을 플랫폼으로 끌어들이는 락인(Lock-in, 고객 이탈 방지) 효과를 노린다. 이는 단순한 기능 추가가 아니라 콘텐츠 생산의 민주화를 통해 시장의 파이를 키우려는 전략이다. 품질의 상향 평준화는 결국 플랫폼 전체의 콘텐츠 밀도를 높이고 사용자의 체류 시간을 증대시키는 비즈니스 임팩트로 이어진다.
100만 구독자와 70만 타이틀이 만드는 오디오 생태계의 포석
Audiobook+ 구독자 수는 이미 100만 명을 넘어섰다. 플랫폼의 연간 반복 매출(ARR, Annual Recurring Revenue)은 1억 달러 달성 궤도에 진입했다. 확보한 오디오북 타이틀은 총 70만 권에 달한다. 단순한 콘텐츠 확장을 넘어 수익 모델의 자립 가능성을 증명한 수치다. 규모의 경제를 확보한 상태에서 AI 생산 도구가 결합하면 콘텐츠 공급 속도는 기하급수적으로 빨라진다. 이는 기존 오디오북 시장의 고비용 구조를 깨뜨리는 결정적인 포석이 된다. 자본 집약적인 성우 섭외와 스튜디오 녹음 과정이 사라진 자리를 AI가 채우며 공급망의 효율성이 극대화된다. 이제 비용의 장벽이 사라진 자리에 창작의 양적 팽창이 시작된다.
사용자가 콘텐츠를 찾는 방식에서도 지형 변화가 일어난다. 자연어 기반의 오디오북 탐색(Discovery) 기능이 도입되었다. 이번 여름에는 프롬프트 기반 플레이리스트에 오디오북 영역까지 포함해 확대한다. 사용자는 이제 특정 제목을 검색하는 대신 자신의 기분이나 상황을 입력해 책을 추천받는다. 검색의 시대에서 발견의 시대로 전환되는 지점이다. 70만 권의 방대한 라이브러리는 AI의 정교한 큐레이션을 통해 비로소 가치를 발한다. 롱테일 콘텐츠가 사용자에게 도달하는 경로가 획기적으로 단축되며 숨겨진 취향의 시장이 열린다. 음악과 팟캐스트 그리고 오디오북이 하나의 오디오 스트림으로 통합되며 소비 경험의 경계가 무너진다.
작가들을 묶어두는 생태계 전략은 디지털을 넘어 물리적 영역으로 확장된다. 미국과 영국 내 작가들을 대상으로 종이책 판매 프로그램을 운영한다. 오디오북 제작부터 종이책 유통까지 이어지는 통합 파이프라인을 구축한 셈이다. 작가는 플랫폼 하나에서 디지털 수익과 물리적 판매 수익을 동시에 관리한다. 이는 단순한 유통 대행이 아니라 작가의 생애 주기 전체를 플랫폼 내에 귀속시키는 락인(Lock-in) 전략이다. 제작 진입장벽이 낮아진 상태에서 유통 채널까지 통합되면 독립 작가들의 진입이 가속화된다. 출판 권력이 대형 출판사에서 플랫폼과 개별 작가로 이동하는 흐름이다. 플랫폼이 출판사의 역할과 유통사의 역할을 동시에 수행하는 수직 계열화를 완성한다.
결과적으로 오디오북 시장의 권력 구조가 재편된다. 과거에는 대형 출판사가 선정하고 전문 성우가 낭독한 소수 정예 콘텐츠가 시장을 독점했다. 이제는 AI가 낭독하고 AI가 추천하며 플랫폼이 유통하는 롱테일 콘텐츠의 시대가 열린다. 100만 명의 유료 구독자는 이 거대한 실험의 초기 검증단 역할을 수행한다. ARR 1억 달러라는 숫자는 오디오북이 더 이상 부가 서비스가 아니라 독립적인 핵심 사업부로 성장했음을 의미한다. 콘텐츠 공급의 민주화가 시장 전체의 파이를 키우고 새로운 소비 패턴을 창출하는 구조다. 이는 단순한 기능 업데이트가 아니라 오디오 생태계의 주도권을 쥐기 위한 치밀한 설계다.




