멀티 에이전트 오케스트레이션 시스템인 Fugu를 출시했다

특정 모델의 갑작스러운 API 접근 제한이나 벤더 락인(Vendor Lock-in)은 기업의 인프라 운영에 치명적인 변수로 작용한다. Sakana AI가 선보인 Fugu는 이러한 단일 벤더 의존성을 타파하기 위해 설계된 멀티 에이전트 오케스트레이션 시스템이다. 이 시스템은 단일 OpenAI 호환 API를 통해 프런티어 수준의 AI 성능을 제공하며, 개발자와 기업이 지정학적 수출 통제나 특정 모델의 서비스 중단 리스크로부터 회복탄력성을 확보하도록 돕는다.

운영 환경과 작업 난이도에 따라 선택 가능한 두 가지 라인업을 갖췄다. 일상적인 작업과 챗봇, Codex(코드 생성 모델) 환경에 최적화된 저지연 모델인 Fugu는 빠른 응답 속도를 우선한다. 반면, AI 연구나 사이버 보안 분석, 다단계 특허 조사와 같이 고도의 정확도가 요구되는 고난도 작업에는 플래그십 티어인 Fugu Ultra를 투입할 수 있다. 시스템의 구조적 유연성은 단일 모델에 고정되지 않고 최적의 성능을 동적으로 라우팅하는 인프라를 구축하려는 기술적 요구에 부합한다.

기술이 실제로 작동하는 방식

단일 모델의 성능 한계가 곧 시스템의 한계라는 인식은 기술적 관성일 뿐이다. Fugu는 거대 단일 모델 구조를 버리고, 복잡한 요청을 분해해 전문 AI 에이전트 풀에 작업을 위임하는 동적 라우팅 방식을 채택했다. 이 시스템은 TRINITY와 Conductor 연구 논문을 핵심 설계 기반으로 삼는다. Fugu 자체는 에이전트 풀 내의 다양한 거대언어모델(LLM)을 호출하도록 훈련된 메타 모델로, 하위 작업을 배분하고 결과를 검증한 뒤 최종 출력을 합성하는 역할을 수행한다.

LiveCodeBench에서 Fugu Ultra는 93.2점을 기록하며 89.8점의 Claude Fable 5를 앞섰다. 대학원 수준의 과학적 추론 능력을 측정하는 GPQA-D(Diamond) 벤치마크에서도 Fugu Ultra는 95.5점을 획득해 94.6점의 Claude Mythos Preview를 상회했다. 이러한 수치는 특정 모델에 대한 의존도를 낮추면서도 프론티어급 성능을 유지할 수 있는 오케스트레이션 기반 인프라의 실효성을 입증한다.

확인해야 할 핵심 지점

기술적 편의 뒤에는 특정 공급업체에 모든 자원을 맡기는 위험이 도사린다. 국가 차원의 인프라를 단일 기업의 모델에 전적으로 의존하는 환경은 수출 통제와 같은 외부 변수가 발생할 경우 서비스가 즉각 중단될 수 있는 취약성을 내포한다. Fugu는 여러 제공업체의 모델을 동적으로 조합하는 오케스트레이션(여러 모델을 상황에 맞춰 연결하고 제어하는 기술) 구조를 통해 특정 벤더에 종속되지 않는 중복성을 AI 스택에 직접 구현했다. 교체 가능한 에이전트 풀을 활용하면 특정 모델의 접근이 차단되더라도 서비스 가동 시간을 안정적으로 유지할 수 있다.

현재 Fugu는 대부분의 지역에서 활용 가능하나 유럽 연합(EU)과 유럽 경제 지역(EEA)은 운영 대상에서 제외된다. Sakana AI는 Fugu의 블랙박스 데이터 라우팅(모델 내부 처리 과정을 외부에서 직접 확인하기 어려운 데이터 경로 설정 방식) 아키텍처를 GDPR(유럽 연합의 개인정보 보호 규정) 기준에 맞추기 위한 기술적 보완을 진행 중이다. 해당 지역 내에서의 운영 제한은 규제 준수를 위한 일시적인 조치이며, 아키텍처 재설계가 완료되는 시점에 서비스 범위가 조정될 예정이다.

특정 모델의 API 정책 변화가 전체 워크플로우를 마비시키는 상황은 더 이상 기술적 불가항력이 아니다. Fugu Ultra가 LiveCodeBench 93.2점과 GPQA-D 95.5점을 기록하며 증명했듯, 이제는 단일 모델의 성능을 맹신하기보다 동적 라우팅을 통한 인프라의 유연성을 확보하는 것이 프론티어급 성능을 유지하는 유일한 전략이다. 지금 즉시 깃허브 저장소의 라우팅 설정 파일을 확인하여 현재 사용하는 모델 체인에 대체 모델을 추가하는 것부터 시작하라. 모델 의존도를 낮추는 아키텍처만이 시스템의 지속 가능성을 결정한다.