투자금과 참여 투자자가 보여주는 신호
AI 모델의 성능 순위가 바뀌는 주기는 이제 수개월에서 수주 단위로 짧아졌다. 인프라 최적화 속도가 서비스의 실질적인 생존을 결정하는 시점에 도달했다. WSJ 보도에 따르면 AI 추론 기업 Baseten(AI 모델의 실행 결과값을 도출하는 추론 최적화 기업)은 130억 달러의 기업 가치를 인정받아 15억 달러 규모의 펀딩 라운드를 최종 확정 짓는 단계에 있다. 단기간에 막대한 자본이 추론 효율화 시장으로 집중되는 양상이다.
Baseten은 요청을 가장 적합한 모델로 라우팅(데이터 전송 경로를 설정하는 기술)하여 추론 속도를 높이고 비용을 절감하는 기술을 제공한다. 특히 역량이 충분하면서도 비용이 저렴한 오픈 소스 대안 모델로 요청을 라우팅함으로써 효율적인 추론 처리를 가능하게 한다. 고비용의 모델을 일괄 적용하는 대신, 각 작업의 특성에 맞춰 최적화된 저비용 오픈 소스 모델을 선택해 추론 비용을 정밀하게 통제하는 방식이다. 이를 통해 기업은 성능 저하 없이 운영 비용을 낮출 수 있다.
130억 달러의 밸류에이션은 추론 레이어의 최적화 기술이 가진 시장 가치를 구체적인 수치로 증명한다. 모델 개발 단계의 경쟁을 넘어 실제 서비스 운영 단계에서 발생하는 비용과 응답 속도 문제를 해결하는 기술에 자본이 몰리고 있다. 오픈 소스 모델을 전략적으로 활용하는 라우팅 기술이 기업의 운영 효율을 결정하는 핵심 지표로 평가받고 있으며, 이는 추론 인프라의 효율성이 곧 경쟁력이 되는 시장 상황을 반영한다.
기업 가치는 반년도 되지 않아 160% 급증했다
숫자가 발표보다 더 명확한 신호를 보냈다. Baseten의 기업 가치는 반년이 채 되지 않은 기간에 160% 급증했다. 5개월 전 50억 달러의 가치로 3억 달러 규모의 Series E(시리즈 E, 후기 단계 투자 라운드)를 유치했으며, 그보다 9개월 전에는 1억 5천만 달러 규모의 Series D(시리즈 D, 성장 단계 투자 라운드)를 유치한 기록이 있다. Series E 유치 이후 불과 5개월 만에 기업 가치가 이 정도로 상승한 것은 이례적인 속도다. 단기간에 집중된 자본 유입은 추론 효율화 기술에 대한 시장의 공격적인 베팅을 보여준다.
이번 투자 라운드는 투자자별로 기업 가치를 다르게 책정하는 split-priced round(분할 가격 펀딩, 투자자별로 서로 다른 밸류에이션을 적용하는 방식)로 진행된다. 일부 투자자는 130억 달러, 다른 투자자들은 110억 달러의 기업 가치를 기준으로 참여했다. 투자자마다 다른 진입 가격을 설정함으로써 기업의 외형적 가치를 극대화하는 방식이다. 이는 겉으로 드러나는 헤드라인 밸류에이션을 최대한 높여 리드 투자자의 성과를 서류상으로 부풀리려는 전략이다. 추론 레이어 최적화 및 오픈소스 모델 라우팅 기술에 대한 시장의 자본 평가 기준이 단순히 기술적 지표를 넘어 금융 공학적 설계와 결합하고 있다.
확인해야 할 핵심 지점
투자 심사역들이 자본을 투입할 지점을 결정하는 기준이 바뀌었다. 2019년에 설립된 Baseten은 사용자가 프롬프트를 제출한 이후 모델이 실제로 결과물을 내놓는 단계인 추론(Inference) 영역에 집중한다. 추론은 모델이 입력된 데이터를 바탕으로 연산을 수행해 최종 응답을 도출하는 모든 과정을 의미한다. The Next Wave는 현재의 시장 상황을 추론 골드러시라고 정의했다. 벤처캐피털들이 거대 모델 개발 자체보다 추론 레이어 구축 기업에 막대한 자금을 쏟아붓는 흐름이 가속화되고 있다.
이번 펀딩 라운드는 Spark Capital, Sands Capital, Altimeter Capital, Wellington Management이 공동으로 주도한다. 네 곳의 투자사가 동시에 리드로 참여하며 자본을 투입했다. 특정 단일 투자사가 아니라 다수의 대형 VC가 공동 주도 방식으로 참여한 점이 특징이다. 이는 추론 레이어의 최적화 능력이 AI 서비스의 실질적인 운영 비용과 응답 속도를 결정짓는 핵심 경쟁력으로 평가받고 있다는 방증이다. 자본 시장은 이제 모델의 파라미터 규모나 학습 데이터의 양보다 추론 단계의 효율성을 더 높은 가치로 책정하고 있다.
Baseten이 입고 있는 수혜는 추론 레이어라는 특정 기술 계층에 대한 시장의 확신을 보여준다. 벤처캐피털의 자금 투입 방향이 인프라의 하단에서 서비스 접점인 추론 단계로 이동하고 있다. 이는 AI 모델을 개발하는 것과 이를 효율적으로 운영하는 것이 서로 다른 기술적 영역임을 의미한다. 추론 레이어의 최적화 여부가 기업의 수익성과 직결된다는 판단이 이번 대규모 투자 유치의 배경이다.
AI 모델 개발보다 실제 서비스 운영 시 발생하는 추론 비용과 응답 속도 최적화가 핵심 과제로 부상했다. Baseten은 분할 가격 방식을 활용해 기업가치를 130억 달러로 책정하며 15억 달러 규모의 투자 유치를 진행 중이다.
자본은 이제 추론 레이어 최적화와 오픈소스 모델 라우팅 기술의 실효성을 기준으로 가치를 평가한다. 인프라 효율성이 곧 기업의 수익성을 결정하는 구조로 시장의 문법이 바뀌었다.




