이번 주 깃허브(코드 저장소)와 Hugging Face(AI 모델 공유 플랫폼)에서 미국 스타트업 Poolside의 이름이 갑자기 보이기 시작했다. 개발자들은 클라우드 API를 거치지 않고 내 노트북에서 직접 돌아가는 고성능 코딩 에이전트가 나왔다는 소식에 빠르게 반응하고 있다.

Laguna XS.2와 M.1의 구체적 스펙

Poolside는 두 가지 Laguna 대규모 언어 모델을 동시에 출시했다. Laguna M.1은 2,250억 개의 파라미터를 가진 MoE(여러 전문가 모델을 섞어 효율을 높인 구조) 모델이며, 실제 연산에 참여하는 활성 파라미터는 230억 개다. Laguna XS.2는 Apache 2.0 라이선스로 공개된 330억 개 파라미터의 MoE 모델이며, 활성 파라미터는 30억 개다. 이들은 단순 채팅을 넘어 스스로 코드를 짜고 도구를 사용하는 에이전트 워크플로우(AI가 자율적으로 작업을 수행하는 방식)에 최적화되었다. 함께 공개된 pool(코딩 에이전트 구동 도구)과 shimmer(모바일 최적화 웹 코딩 환경)를 통해 개발자는 장소에 상관없이 에이전트 기반 개발을 할 수 있다. XS.2는 오픈 소스로 제공되며, M.1은 현재 OpenRouter, Ollama, Baseten 같은 배포 플랫폼을 통해 일시적으로 무료 API 형태로 제공된다.

큐웬 기반 튜닝을 버린 독자 학습 경로

예전에는 많은 미국 AI 랩들이 중국 알리바바의 Qwen(중국어 기반 고성능 언어 모델) 시리즈를 가져와 미세 조정하는 방식을 선택했다. Poolside는 이러한 경로를 거부하고 30조 개의 토큰(데이터 최소 단위)을 사용해 모델을 처음부터 직접 학습시켰다. 학습 과정에서는 Muon(학습 속도를 높여주는 최적화 도구) 최적화 기법을 도입해 기존 업계 표준보다 학습 속도를 약 15% 끌어올렸다. 데이터 선정에는 AutoMixer(데이터 조합을 자동으로 결정하는 시스템)를 활용해 60개의 프록시 모델로 코드, 수학, 웹 데이터의 최적 비율을 과학적으로 찾아냈다. 전체 학습 데이터의 13%는 AI가 생성한 고품질의 합성 데이터(특정 기술 학습을 위해 인위적으로 만든 자료)로 채워 실세계에서 찾기 힘든 엣지 케이스를 학습시켰다.

개발자가 바로 체감하는 변화는 이제 인터넷 연결 없이 노트북 한 대만으로 강력한 코딩 에이전트를 돌릴 수 있다는 점이다. 특히 정부나 기업처럼 보안이 극도로 중요한 환경에서 모델 가중치(AI의 지능이 저장된 수치 데이터)를 온프레미스(자체 서버 설치 방식)로 구축해 오프라인으로 운영하는 것이 가능해졌다. 모델은 기초 학습 후 가상 환경에서 실제 소프트웨어 엔지니어링 문제를 풀며 보상을 받는 강화 학습(시행착오를 통해 최적의 답을 찾는 방식) 과정을 거쳤다. 이 과정을 통해 단순한 텍스트 생성을 넘어 복잡한 프로젝트를 계획하고 실행하는 에이전트로서의 능력을 갖추게 되었다.

이제 코딩 AI의 격전지는 클라우드 API가 아니라 개발자의 로컬 GPU 메모리 위로 옮겨갔다.