알리바바 Qwen3.7-Plus, 멀티모달 성능 높이고 API 가격 60% 낮췄다

알리바바가 멀티모달 능력을 강화하고 비용을 60% 낮춘

고성능 모델에 멀티모달 기능을 더하면 운영 비용이 상승하는 것이 일반적이다. 알리바바는 오히려 비용을 60% 낮춘 Qwen3.7-Plus를 출시했다. 텍스트뿐 아니라 비디오와 이미지 입력까지 지원하는 멀티모달 능력을 강화했음에도 이전의 텍스트 전용 모델인 Qwen3.7-Max보다 저렴하다. 100만 토큰당 0.4달러에서 1.6달러 사이의 저렴한 가격대를 형성해 매달 청구되는 API 호출 비용에 부담을 느끼는 개발자의 실질적인 진입 장벽을 낮췄다.

API 레벨에서는 `preserve_thinking` 파라미터를 통해 대화 턴 사이의 내부 논리 루프를 유지하는 방식을 도입했다. 모델이 `<think>` 블록을 보존함으로써 문맥을 놓치거나 캐시된 이력을 불필요하게 다시 계산하는 자원 낭비를 막는 구조다. 이는 Anthropic(앤스로픽)의 'Extended Thinking'이나 OpenAI(오픈에이아이)의 추론 전달 메커니즘과 유사한 기술적 접근이다. 내부 추론 과정을 세션 간에 유지함으로써 응답의 일관성을 확보하고 계산 자원의 효율을 극대화했다.

고비용 플래그십 모델을 대체해 RPA(로봇 프로세스 자동화)나 데이터 파이프라인의 운영 비용을 얼마나 낮출 수 있는지가 실무적인 판단 기준이 된다. 텍스트 외의 영상과 이미지 분석 기능을 추가하면서도 비용을 삭감해 대규모 데이터 처리 환경에서의 경제성을 확보했다. 멀티모달 확장과 비용 절감을 동시에 구현해 실제 서비스 적용을 위한 운영 효율을 높인 결과다.

Qwen 시리즈의 기존 오픈소스 전략에서 벗어나 폐쇄형 상용

79.0점이라는 수치는 기존 인터페이스 이해 벤치마크의 기준점을 높였다. ScreenSpot Pro(화면 요소 인식 및 제어 성능 측정 도구)에서 Qwen3.7-Plus는 GPT-5.4의 67.4점과 Claude-Opus-4.6의 49.5점을 상회하며 뚜렷한 성능 우위를 보였다. 특히 Claude-Opus-4.6과는 약 30점에 가까운 격차를 기록하며 시각적 인터페이스 분석 능력을 증명했다. 터미널 코드 실행 능력을 평가하는 Terminal Bench 2.0-Terminus에서도 70.3점을 기록하며 최상위권을 차지했다. 이는 DeepSeek-V4-Pro Max의 67.9점과 Gemini-3.1 Pro의 63.5점을 앞선 결과다. 단순한 텍스트 생성을 넘어 실제 컴퓨팅 환경의 제어와 코드 실행이라는 실무 영역에서 경쟁 모델들을 수치로 압도했다.

전용 API(응용 프로그램 인터페이스)와 Qwen Chat을 통해서만 접근 가능한 폐쇄형 상용 라이선스 체계를 적용했다. 그동안 강력한 성능의 오픈소스 모델을 시장에 지속적으로 출시하며 일관되게 유지해 온 전략에서 크게 벗어난 결정이다. 모델의 내부 가중치를 공개하지 않고 전용 인터페이스를 통해서만 기능을 제공하는 폐쇄형 방식을 택했다. 이는 오픈소스 기반의 생태계 확장보다 상용 서비스로서의 통제권과 수익성을 우선시한 전략적 선택이다. 기존의 개방형 모델 공급 방식에서 벗어나 독점적인 상용 모델 체제로 운영 방침을 변경했다.

성능 지표의 상승과 라이선스 정책의 변화는 동시에 일어났다. 벤치마크에서 증명된 고성능 모델을 오픈소스로 풀지 않고 폐쇄형 API로 묶어 제공하는 구조다. 기술적 우위를 상업적 가치로 직접 연결하려는 의도로 풀이된다.

100만 토큰의 컨텍스트 윈도우와 내부 사고 과정(CoT)

왜 복잡한 다단계 과업을 수행하는 모델은 중간에 논리를 놓칠까? Qwen3.7-Plus는 100만 토큰의 컨텍스트 윈도우를 지원하며 내부 사고 과정인 CoT(Chain-of-Thought, 사고의 사슬) 처리에 최대 256K 토큰을 전용으로 할당한다. 이는 에이전트가 장기 과업을 수행하는 과정에서 분석 궤적을 잃지 않도록 제어하는 장치다. 전체 코드베이스를 한 번에 분석하거나 복잡한 엣지 케이스를 정밀하게 평가하는 작업에서 모델이 일관된 추론을 유지하게 한다. 대규모 데이터를 처리하면서도 논리적 흐름을 유지하는 데 집중한 설계다.

고가의 프런티어 모델을 매번 호출하는 방식은 고빈도 워크플로우에서 운영 비용 부담을 높인다. Qwen3.7-Plus는 GPT-5나 Claude-Max 급의 고가 모델을 직접 대체하도록 설계되었다. 반복적인 시스템 운영과 시각적 인터페이스 해석, 코드 생성 작업이 중심인 RPA(로봇 프로세스 자동화) 및 데이터 엔지니어링 파이프라인에 투입 가능하다. 시각적 인터페이스를 해석해 자동화 경로를 생성하거나 반복적인 코드 생성 작업을 처리하는 데 최적화되어 있다. 특히 OpenAI 호환 엔드포인트를 제공하여 기존에 구축된 API 인프라의 변경을 최소화하면서 즉시 통합할 수 있다. 고성능 모델의 기능은 유지하면서 운영 비용을 낮춰야 하는 기업용 데이터 파이프라인의 실무적 대체제로 작동한다.

OpenAI나 Anthropic의 고성능 모델을 사용하며 API 비용에 부담을 느끼는 개발자에게 Qwen3.7-Plus는 구체적인 대안이 된다. 비용을 60% 낮추면서 영상과 이미지 분석 기능을 추가한 결과다.

preserve_thinking 파라미터와 256K 토큰의 CoT 할당량은 고도화된 추론의 연속성을 제공한다. 고비용 플래그십 모델을 대체해 RPA나 데이터 파이프라인의 운영 비용을 얼마나 절감할 수 있는지가 도입의 핵심이다. 모델 선택의 기준은 이제 단순 성능에서 운영 효율로 전환된다.

알리바바 Qwen3.7-Plus, 멀티모달 성능 높이고 API 가격 60% 낮췄다

알리바바가 멀티모달 능력을 강화하고 비용을 60% 낮춘

Qwen 시리즈의 기존 오픈소스 전략에서 벗어나 폐쇄형 상용

100만 토큰의 컨텍스트 윈도우와 내부 사고 과정(CoT)

관련 기사