매일 아침 개발자 커뮤니티에서는 적은 비용으로 고성능 추론이 가능한 모델을 찾는 논의가 활발하다. 최근 DeepSeek(중국 기반의 AI 연구소)가 공개한 모델들은 기존의 거대 언어 모델들이 요구하던 막대한 컴퓨팅 자원 없이도 유사한 성능을 구현하며 시장의 주목을 받았다. 특히 이들이 공개한 모델들은 오픈 웨이트(모델의 가중치를 공개하여 누구나 내려받아 실행할 수 있는 상태)로 배포되어, 개발자들이 자신의 인프라에서 직접 모델을 구동할 수 있는 환경을 제공했다.
DeepSeek의 450억 달러 가치 평가와 투자 배경
DeepSeek는 최근 첫 번째 벤처 캐피털 투자 유치 협상을 진행 중이며, 기업가치는 200억 달러에서 450억 달러 수준까지 급등했다. 이번 투자 라운드는 중국의 국영 투자 기관인 China Integrated Circuit Industry Investment Fund(반도체 산업 육성을 위한 국영 투자 펀드)가 주도하는 것으로 알려졌다. 량원펑(Liang Wenfeng)이 설립한 이 회사는 그동안 외부 투자 없이 운영되었으나, 경쟁사들의 인재 영입 공세에 대응하고 직원들에게 스톡옵션을 제공하기 위해 자금 조달을 결정했다. 텐센트(중국의 대형 IT 기업)와 알리바바(중국의 전자상거래 및 클라우드 서비스 기업) 역시 이번 투자 참여를 논의 중인 것으로 확인된다.
미국 모델과의 기술적 차별점과 인프라 전략
예전에는 OpenAI나 Anthropic과 같은 미국 기업들이 주도하는 모델을 사용하는 것이 표준이었으나, 이제는 제한된 컴퓨팅 자원으로 효율성을 극대화하는 방식이 새로운 기준점으로 떠오르고 있다. DeepSeek는 화웨이(중국의 통신 장비 및 하드웨어 제조사)의 칩셋에 최적화된 모델을 개발하여, 미국산 반도체 수급이 어려운 환경에서도 독자적인 AI 생태계를 구축하는 데 성공했다. 이러한 기술적 결합은 중국이 미국 기술 의존도를 낮추고 자국 내 AI 경쟁력을 확보하려는 핵심 전략으로 관찰된다. DeepSeek의 모델들은 Hugging Face를 통해 공개되어 있으며, 개발자들은 이를 통해 모델의 가중치를 직접 확인하고 자신의 서버 환경에 맞게 최적화할 수 있다.
개발자가 바로 체감하는 변화는 모델의 접근성과 효율성이다. 기존의 폐쇄형 모델들이 API 호출 비용과 인프라 제약으로 인해 특정 환경에서만 사용 가능했다면, DeepSeek가 제시하는 방식은 하드웨어 제약이 있는 환경에서도 고성능 모델을 구동할 수 있는 실무적 대안을 제공한다. 이는 향후 6개월 내에 기업들이 자체 서버나 로컬 환경에서 고성능 AI를 운영하려는 수요와 맞물려, 오픈 웨이트 모델의 활용도가 더욱 높아질 것임을 시사한다.
AI 모델의 가치는 이제 파라미터의 규모가 아니라, 제한된 하드웨어 환경에서 얼마나 효율적으로 추론 성능을 유지하느냐에 따라 결정된다.




