B2B 리서치 에이전트 'Sakana Marlin'을 출시했다

챗봇에 질문을 입력하면 수초 내에 요약된 답변이 돌아오는 즉각적인 반응은 이제 당연한 상식이 됐다. 사카나 AI(Sakana AI)는 이러한 기존 챗봇의 텍스트 생성 방식에서 벗어나 심층적인 장기 추론(long-horizon reasoning)에 집중하는 B2B 리서치 에이전트 '사카나 말린(Sakana Marlin)'을 출시했다. 가상 CSO(Chief Strategy Officer, 최고 전략 책임자)로 명명된 이 에이전트는 기업과 금융 기관, 싱크탱크를 대상으로 하는 자율형 리서치 도구다. 즉각적인 답변보다 깊이 있는 분석이 필요한 전문 영역의 업무를 자율적으로 수행하며, 기존의 단순 텍스트 생성 모델이 가진 한계를 장기 추론 능력으로 해결한다.

이 시스템의 기술적 구현은 네이처(Nature)지에 게재된 '더 AI 사이언티스트(The AI Scientist)' 프로젝트의 프레임워크를 활용해 구축했다. 여기에 2025년 6월 아파치 2.0(Apache 2.0) 라이선스로 공개된 오픈소스 알고리즘 라이브러리 '트리퀘스트(TreeQuest)'가 기술적 토대로 결합했다. 사카나 AI는 연구 단계의 알고리즘을 상용 라이브러리 형태로 배포하고 이를 말린의 추론 엔진으로 연결하는 구조를 택했다. 허용 범위가 넓은 아파치 2.0 라이선스를 통해 기술적 기반을 공개하는 동시에, 이를 상용 제품인 말린에 적용해 학술적 성과를 실무적 도구로 전환했다.

결과적으로 사카나 말린은 단순한 질의응답 도구를 넘어 전문적인 리서치 수행이 가능한 기술적 기반을 갖췄다. 네이처지에 실린 연구 프레임워크와 오픈소스 라이브러리를 결합해 B2B 환경에서 요구하는 심층 분석 역량을 구현한다. 이는 AI가 단순한 보조 도구에서 벗어나 기업의 전략적 의사결정을 지원하는 자율형 에이전트로 작동하는 구체적인 사례가 된다.

기술이 실제로 작동하는 방식

대부분의 사용자가 챗봇에게 수초 내의 즉각적인 답변을 기대할 때, 전문 리서치 영역에서는 정반대의 접근 방식이 필요하다. Sakana Marlin은 답변을 즉시 내놓는 대신 최대 8시간 동안 스스로 통제하는 추론 루프를 실행한다. 이 과정을 통해 심층적으로 조사되고 인용이 명확한 100쪽 이상의 전략 보고서와 경영진용 슬라이드를 생성한다. 단순한 요약을 넘어 참고 문헌과 부록을 포함한 구조화된 전략 옵션을 도출하는 심층 리서치 체계를 작동시킨다.

이러한 구동 방식의 핵심은 AB-MCTS(Adaptive Branching Monte Carlo Tree Search, 적응형 분기 몬테카를로 트리 탐색) 엔진이다. 리서치 과정을 가능성의 분기 트리로 처리하며, 베이지안 결정 프레임워크를 통해 새로운 가설을 만드는 확장(Exploration)과 기존 솔루션을 정교화하는 심화(Exploitation) 사이의 균형을 동적으로 맞춘다. 외부 피드백 신호에 따라 두 행동을 조절함으로써, 단순히 같은 질문을 여러 번 던지는 반복 샘플링 방식의 한계를 극복한다.

추론 시간 연산(Inference-time compute, 모델이 답변을 내놓기까지 사용하는 계산량)을 확장해 결과물의 밀도를 높이는 이 방식은 AI 투입 기준을 바꾼다. 단순 챗봇의 응답 속도가 아니라, 전문 컨설팅 수준의 심층 분석이 필요한 작업에 AI를 배치할 수 있는 기술적 판단 기준을 제공한다.

사용자의 반복적인 프롬프트 입력 없이 자율적인 디지털 전략

원하는 결과물을 얻기 위해 챗봇과 수십 번 질문과 답변을 주고받는 프롬프트 엔지니어링 과정은 번거롭다. Sakana Marlin은 사용자가 핵심 리서치 주제와 범위만 설정하면 이 반복 과정을 생략한다. AI가 스스로 초기 가설을 수립하고 웹을 탐색해 데이터를 수집하며, 수집한 소스를 교차 검증해 발견한 사실을 확인한다. 이후 복잡한 비즈니스 환경 내의 인과 관계를 매핑하는 과정을 거쳐 전문적인 포트폴리오를 완성한다. 사용자의 개입 없이 수 시간 동안 자율적인 디지털 전략 팀처럼 작동하며 리서치의 전 과정을 스스로 처리한다.

이러한 자율적 수행 능력은 Multi-LLM AB-MCTS 아키텍처를 통해 구현한다. AB-MCTS(적응형 분기 몬테카를로 트리 탐색)는 최적의 추론 경로를 찾기 위해 여러 가능성을 탐색하고 선택하는 알고리즘이다. Sakana Marlin은 검색 트리의 세 번째 차원에 특정 작업에 가장 적합한 모델을 동적으로 호출하는 기능을 도입했다. 단일 모델에 의존하지 않고 각 작업의 성격에 따라 가장 적합한 모델을 실시간으로 선택해 사용한다. 이는 단순한 실험실 수준의 연구를 넘어 상업적 활용이 가능한 엔진으로 성능을 확장한 핵심 장치다.

전문 컨설팅 수준의 심층 분석 작업에 AI를 투입하기 위해서는 이처럼 모델을 동적으로 선택하고 추론 경로를 최적화하는 기술적 판단 기준이 필요하다. 단순한 챗봇의 즉각적인 답변을 넘어, 복잡한 비즈니스 로직을 스스로 설계하고 검증하는 자율 추론 루프를 구축하는 것이 핵심이다. 이를 통해 사용자는 반복적인 프롬프트 입력 없이도 고도의 전략적 결과물을 확보하는 환경을 구축한다.

수초 내에 답변을 내놓는 일반적인 챗봇의 즉각성과 달리, 사카나 말린은 AB-MCTS를 통해 추론 시간 연산을 확장하며 최대 8시간의 자율 루프를 수행한다. 이 과정에서 AI는 단순 요약을 넘어 100쪽 이상의 전략 보고서를 스스로 구성하는 전문 컨설팅 수준의 심층 분석 능력을 증명한다.

이제 AI 도입의 판단 기준은 응답 속도가 아니라, 복잡한 문제 해결을 위해 투입할 추론 시간의 설계 능력으로 바뀐다. 단순한 질의응답을 넘어 기업의 전략적 의사결정을 자동화하는 실무적 기준점이 마련됐다.