"LLM에 의한 죽음"이라던 Stack Overflow, 데이터 팔아 매출 2배

예전에는 개발자가 코딩 중 막히면 가장 먼저 Stack Overflow 포럼에서 정답을 찾았다.

지금은 ChatGPT나 Cursor 같은 AI 도우미와 비공개 채팅으로 문제를 해결한다.

분기점은 LLM(대규모 언어 모델) 기반의 코드 작성 AI 도구들이 대중화된 시점이다.

지난달 Stack Overflow에 올라온 질문 수는 6,866개였다. 2008년 서비스 출시 초기 수준으로 회귀한 수치다. 일론 머스크는 2023년 7월 이 현상을 두고 "LLM에 의한 죽음"이라고 정의했다. 하지만 포럼의 공동화가 곧 회사의 파산을 의미하지는 않았다. 참여도는 급락했지만 재무 제표는 오히려 개선되는 기현상이 나타났다.

질문 수 6,866개, 2008년 수준으로 회귀한 포럼

개발자들이 더 이상 포럼에 질문을 남기지 않는 이유는 무엇일까. 지난달 스택 오버플로우(Stack Overflow, 개발자 Q&A 포럼)에 올라온 질문 수는 6,866개다. 2008년 서비스 출시 초기 수준으로 회귀한 수치다. 팬데믹 기간 동안 정보 탐색 수요가 몰리며 영향력이 정점에 달했던 시기와 극명하게 대비된다. 챗GPT(ChatGPT), 커서(Cursor), 클로드(Claude), 구글 제미나이(Google Gemini), 마이크로소프트 코파일럿(Microsoft Copilot) 같은 코드 작성 AI 도우미의 확산이 트래픽 급감의 원인이다. 일론 머스크는 2023년 7월 이 상황을 LLM에 의한 죽음이라고 정의했다. 개발자의 지식 탐색 경로가 공개 게시판에서 비공개 AI 채팅창으로 빠르게 이동했다.

커뮤니티 참여도의 급락이 곧바로 재무적 위기로 연결되지는 않았다. 스택 오버플로우의 연간 매출은 약 1억 1,500만 달러를 기록했다. 기존 매출 규모와 비교해 약 2배 성장한 수치다. 손실액 규모 역시 가파르게 감소했다. FY2023 기준 8,400만 달러였던 손실은 최근 회계연도에 2,200만 달러까지 줄어들었다. 대규모 해고를 포함한 강도 높은 비용 절감 단행이 수익성 개선의 직접적인 요인이 됐다. 생성 AI의 타격으로 위기를 맞은 체그(Chegg, 온라인 학습 플랫폼)와는 다른 양상이다. 과거에 축적한 콘텐츠의 가치를 새로운 수익원으로 전환하는 데 성공했다.

수익 구조의 중심축이 광고에서 기업용 솔루션과 데이터 라이선스로 완전히 옮겨갔다. 스택 인터널(Stack Internal, 기업 내부 지식 관리 AI 솔루션)은 현재 전 세계 25,000개 기업에서 도입해 사용 중이다. 수년간 쌓인 수백만 개의 질문과 답변 데이터를 기반으로 생성 AI 추가 기능을 제공하는 방식이다. AI 기업에 데이터를 판매하는 라이선스 사업 모델도 도입했다. 레딧(개발자 커뮤니티)이 2024년에 사용자 생성 콘텐츠 라이선스로 2억 달러 이상의 수익을 창출한 사례와 궤를 같이한다. LLM이 작동하기 위해 거대한 양의 고품질 데이터가 필요하다는 점을 이용했다. 스택 오버플로우가 보유한 디지털 데이터 창고가 AI 시대의 핵심 자산이 된 셈이다.

AI와 개발자 지식 사이에는 기묘한 순환 구조가 형성됐다. LLM은 코딩 문제와 해결 방법에 관한 데이터를 학습하기 위해 스택 오버플로우의 데이터를 필요로 한다. 하지만 정작 개발자들은 AI 도구를 사용하면서 더 이상 공개 포럼에 질문을 올리지 않는다. 새로 축적되는 공개 지식의 양은 줄어들고 기존 데이터의 노후화는 빨라진다. AI가 공개 지식 공유 생태계를 약화시키면서도 동시에 그 결과물인 데이터를 갈구하는 모순이 발생한다. 회사는 커뮤니티의 활성도라는 전통적 지표 대신 데이터 자산의 판매 가치에 집중하는 전략을 택했다.

광고 버리고 'Stack Internal'과 데이터 라이선스로 전환

단순한 코딩 오류를 해결하기 위해 구글 검색과 포럼을 오가던 습관이 여전히 유효할까. 스택 오버플로우(Stack Overflow)는 광고 수익 중심의 사업 구조를 기업용 솔루션과 데이터 라이선스 판매로 완전히 바꿨다. 스택 인터널(Stack Internal)은 기업 내부의 파편화된 기술 지식을 생성 AI로 연결해 관리하는 기업용 지식 솔루션이다. 현재 전 세계 25,000개 기업이 이 서비스를 도입해 사내 위키와 문서를 AI로 검색하고 활용한다. 트래픽 규모에 의존하던 광고 모델을 버리고 데이터 자산의 소유권을 활용한 B2B 모델로 수익원을 옮긴 결과다.

데이터 라이선스 판매 전략은 레딧(개발자 커뮤니티)이 증명한 수익 경로를 그대로 따른다. 레딧은 2024년 사용자 생성 콘텐츠 라이선스 계약만으로 2억 달러 이상의 수익을 기록했다. 스택 오버플로우 역시 AI 기업들이 갈구하는 고품질 학습 데이터를 판매하며 매출 규모를 키웠다. 연간 매출은 약 1억 1,500만 달러를 기록하며 이전 대비 거의 두 배 수준으로 증가했다. FY2023 기준 8,400만 달러에 달했던 영업 손실은 최근 회계연도 기준 2,200만 달러까지 빠르게 감소했다. 대규모 해고를 통한 비용 절감과 더불어 수십 년간 쌓인 콘텐츠를 직접 판매하는 전략이 적중했다.

프라샨트 찬드라세카(Prashanth Chandrasekar) CEO는 유입되는 질문의 성격이 변했다는 점에 주목한다. 기초적인 문법이나 단순 설정 오류 같은 질문의 유입은 급격히 줄어들었다. 반면 시스템 아키텍처 설계나 복잡한 런타임 버그 수정 같은 고난도 질문은 여전히 포럼에 올라온다. LLM(대규모 언어 모델)의 추론 성능은 결국 사람이 직접 검증하고 선별한 데이터의 품질에 수렴한다. 스택 오버플로우는 기술 분야에서 가장 정제된 데이터 창고로서의 지위를 이용해 AI 기업과의 협상력을 높였다.

AI 모델과 데이터 공급자 사이에는 기묘한 순환 구조가 형성됐다. LLM은 성능 고도화를 위해 스택 오버플로우가 보유한 정제된 질의응답 데이터를 계속 필요로 한다. 하지만 정작 개발자들은 공개 포럼에 질문을 올리는 대신 AI와의 비공개 채팅창에서 답을 찾는다. 이 과정에서 웹상에 새로 축적되는 공개 지식의 양은 절대적으로 줄어든다. LLM이 학습할 재료를 스스로 없애는 모순이 발생하지만, 플랫폼은 이 희소성을 이용해 데이터 판매 단가를 높이는 전략을 취하고 있다.

스택오버플로우는 LLM과의 경쟁 대신 AI 학습 데이터 공급망 진입을 택했다. 서비스 이용자 감소라는 위기를 B2B 데이터 판매 매출로 상쇄하며 수익 구조를 완전히 바꿨다. 커뮤니티라는 서비스 모델보다 그 안에 쌓인 정제된 데이터라는 자산의 가치가 더 커진 결과다. 이제 플랫폼의 생존은 트래픽 규모가 아니라 데이터의 독점적 가치로 결정된다.

"LLM에 의한 죽음"이라던 Stack Overflow, 데이터 팔아 매출 2배

질문 수 6,866개, 2008년 수준으로 회귀한 포럼

광고 버리고 'Stack Internal'과 데이터 라이선스로 전환

관련 기사