제로데이 스스로 찾는 Claude Mythos, 무너진 패치 골든타임

발표에서 확인된 핵심 사실

취약점 공고가 뜨기 전까지는 패치 우선순위를 정하기 어렵다. 기존 AI는 CVE(Common Vulnerabilities and Exposures, 공통 취약점 및 노출) 설명이 있어야 취약점을 공격할 수 있었으나, Claude Mythos Preview는 주요 운영체제와 브라우저에서 수천 개의 제로데이 취약점을 자율적으로 발견했다. CyberGym 취약점 재현 벤치마크에서는 83.1%의 점수를 기록했다. 이 모델은 특정 분야에 국한된 좁은 의미의 사이버 모델이 아니라, 고급 사이버 보안 기능을 탑재한 범용 프런티어 모델이다.

OpenAI는 디지털 방어자가 실무에 사용할 수 있도록 특별히 설계한 사이버 보안 전용 모델 GPT-5.4-Cyber를 발표했다. 이번 모델 출시는 OpenAI가 추진하는 사이버 보안 전략의 다음 단계를 공개한 조치다. 방어 전용 모델의 등장은 AI를 활용한 공격 위협이 실질적인 수준으로 올라왔음을 보여준다.

Claude.ai와 Claude Cowork에는 모델이 프롬프트에 응답할 때 얼마나 많은 노력(effort)을 사용할지 사용자가 직접 제어하는 기능이 도입될 예정이다. 사용자가 응답 과정의 자원 투입량을 결정하는 제어권이 추가되는 것이다. 이코노미스트(The Economist)는 프런티어 AI를 다루는 방식에 실질적인 변화를 가져오는 전환점이 될 수 있다는 점에서 현재의 상황을 'Mythos moment'라고 명명했다.

발표에서 확인된 핵심 사실, 추가 쟁점

CVSS 점수 하나만으로 패치 순서를 정하는 방식은 실제 공격 상황을 반영하지 못한다. 이에 단일 점수 체계의 한계를 극복하기 위해 3계층 결정 트리 방식이 제안되었다. 이론적 심각도를 측정하는 CVSS(Common Vulnerability Scoring System, 공통 취약점 점수 시스템)에 실제 공격 여부를 기록한 CISA KEV(Cybersecurity and Infrastructure Security Agency Known Exploited Vulnerabilities)와 공격 가능성을 예측하는 EPSS(Exploit Prediction Scoring System)를 결합한 필터다. 이 프로세스는 API를 통해 자동화할 수 있다. 단순 심각도 중심의 우선순위 지정 방식을 실제 위협 기반으로 전환한 결과다.

2주라는 짧은 간격으로 해킹이 가능한 모델이 두 곳에서 각각 출시되었다. Anthropic과 OpenAI는 해당 모델을 개발했으나 일반 대중에게는 제공하지 않기로 결정했다. 특히 Mythos는 'Project Glasswing'이라는 제한적 프리뷰 형태로 운영된다. 주요 클라우드 제공업체와 보안 기관 등 검증된 파트너와 일부 사이버 보안 전문가, 선정된 조직만이 접근 권한을 가진다. 모델의 파괴력을 고려해 접근 경로를 극도로 제한한 조치다.

목요일에 출시된 Claude Opus 4.8은 기존 Opus 4.7 대비 가시적인 개선을 이룬 모델이다. Anthropic은 이를 겸손하지만 실질적인 향상이라고 정의했다. 하지만 Mythos가 보유한 고도의 사이버 보안 기능은 시장에 다른 긴장감을 준다. 해당 기능이 초래할 잠재적 영향에 대해 세계 지도자들과 기업 경영진들이 구체적인 우려를 표하고 있다. 성능의 향상이 보안 위협의 확장으로 이어질 수 있다는 판단이다.

기존 방식과 달라진 지점

보안 사고의 비용은 단순한 패치 누락이 아니라 권한 탈취로 인한 데이터 유출 규모로 결정된다. 타겟 머신 제어를 위해 수십 단계의 순차적 실행이 필수적인 고급 다단계 사이버 보안 테스트에서 Mythos는 OpenAI의 주요 모델과 이전 Claude 버전을 모두 앞섰다. 모델이 스스로 공격 경로를 설계하고 수십 번의 명령을 순차적으로 수행해 제어권을 획득하는 능력이 검증된 결과다.

검증된 파트너 세트에게만 제한적으로 제공되던 배포 전략은 기존 Claude 모델들의 전면 공개 방식과 대조적이다. Mythos는 일반 목적의 공개 모델이 아니라 사이버 보안과 자율 코딩 같은 고위험 도메인을 겨냥해 엄격하게 관리되는 시스템으로 구축되었다. Anthropic은 시장에 큰 영향을 줄 수 있는 이 강력한 모델을 준비하여 향후 몇 주 내에 모든 고객에게 출시할 예정이다. 프런티어 모델의 포지셔닝이 범용성에서 고위험 도메인 제어로 이동했다.

Docker(도커)의 CVE-2026-34040 취약점은 요청 본문이 1MB를 초과할 때 인증 플러그인을 우회하는 문제를 드러냈다. CSA/Zenity(클라우드 보안 연합 및 제니티) 조사에 따르면 조직의 53%가 AI 에이전트의 권한 초과 사례를 경험했다. AI 에이전트의 권한 경계 우회 리스크가 실질적인 위협으로 부상한 결과다. 한편 Claude Opus 4.8은 근거가 부족함에도 성급하게 결론을 내리는 일반적인 문제를 개선해 정직성(honesty) 측면의 벤치마크 성능을 높였다.

모델의 공개 버전 출시가 임박했다

전문가가 수개월 걸려 찾아내던 취약점을 AI가 단시간에 해결하는 단계에 진입했다. Anthropic은 Claude Mythos Preview의 공개 버전을 제작하는 데 상당한 진전을 보였으며 수주 내에 사용자가 이용 가능한 모델을 출시할 수 있다고 언급했다. 이 모델의 코딩 능력은 최상위 숙련자를 제외한 거의 모든 인간의 취약점 탐색 및 악용 능력을 넘어선 수준이다. Anthropic의 모델은 Mythos, OpenAI의 모델은 GPT-5.4-Cyber로 명명됐다.

28,377개의 실제 취약점을 대상으로 CISA KEV(Known Exploited Vulnerabilities, 알려진 취약점 목록), EPSS(Exploit Prediction Scoring System, 취약점 악용 예측 점수 체계), CVSS(Common Vulnerability Scoring System, 공통 취약점 점수 시스템)를 결합한 3계층 필터를 검증했다. 그 결과 공격받은 취약점의 85.6%를 커버했으며 긴급 수정 작업 부하를 약 95% 감소시켰다. 최종적으로 보안 패치 효율성이 18배 향상되는 결과가 도출됐다. 데이터 기반의 필터링이 대응 우선순위를 결정하는 실질적 기준이 됐다.

OpenAI는 블로그 게시물을 통해 현재 사용 중인 안전장치 클래스가 사이버 리스크를 충분히 감소시켜 광범위한 배포를 지원할 수 있다고 주장했다. 하지만 미래 모델의 능력이 현재의 최신 목적 기반 모델들을 빠르게 능가할 것이라고 전망했다. 사이버 보안의 AI 안전성을 지속적으로 확보하기 위해 더 광범위한 방어 체계가 필요하다는 입장이다. 모델의 성능 진화 속도가 기존 방어 체계의 확장 필요성을 가속하고 있다.

현장에서 달라지는 비용과 판단

서비스 이용료가 동결되었다고 해서 시장의 역학 관계까지 멈춘 것은 아니다. Anthropic은 Claude Opus 4.8의 가격을 이전 모델과 동일하게 책정했다. 동시에 수익과 기업 고객 확보 측면에서 OpenAI와의 격차를 빠르게 좁히고 있다. 가격 경쟁보다 제품의 기업 시장 침투력을 통해 실질적인 점유율을 높이는 전략이다.

2026년 4월 7일 출시된 Mythos는 에이전트 기반의 코딩과 추론 능력을 갖춘 범용 시스템이다. 다만 Anthropic은 Claude Mythos Preview 모델을 비공개로만 출시했다. 해커나 악의적인 행위자가 해당 모델의 능력을 악용할 가능성이 크다는 판단 때문이다. 성능의 고도화가 보안 위협의 증가로 이어진 결과다.

취약점 공개 후 실제 공격까지 걸리는 시간은 이제 시간 단위로 단축되었다. Langflow(AI 워크플로우 빌더)의 CVE-2026-33017(CVSS 9.8)은 공개 20시간 만에, Marimo(데이터 탐색 노트북)의 CVE-2026-39987(CVSS 9.3)은 9시간 41분 만에 공격받았다. 공개된 개념 증명(PoC)이 없는 상태에서도 공격이 즉각적으로 이루어지고 있다.

Flowise(로우코드 AI 빌더)의 CVE-2025-59528(CVSS 10.0) 같은 AI 빌더 도구의 침해는 단일 시스템 해킹 이상의 피해를 야기한다. Langflow나 n8n(워크플로우 자동화 도구)이 뚫리면 내부에 저장된 프런티어 모델 API 키와 데이터베이스 자격 증명, OAuth 토큰이 함께 유출된다. 도구 하나가 연결된 모든 비즈니스 시스템의 권한을 여는 통로가 된다.

CVSS 점수 기반의 우선순위 선정이나 정기 점검일까지 업데이트를 미루던 관행은 무의미해졌다. Claude Mythos Preview가 주요 OS와 브라우저에서 수천 개의 제로데이 취약점을 자율적으로 발견하며 공격의 임계점을 낮췄다.

CISA KEV, EPSS, CVSS를 결합한 3단계 의사결정 트리 필터는 긴급 대응 업무를 95% 감소시킨다. 이제는 AI 에이전트의 권한 우회 가능성을 고려한 인증 경계 테스트 기준과 패치 주기 설정이 보안의 실질적 척도가 된다.