C/C++ 메모리 버그, 스스로 찾고 고치는 Anthropic의 취약점 탐지 프레임워크

발표에서 확인된 핵심 사실

수작업으로 며칠씩 매달리던 C/C++ 메모리 버그 수정 작업이 단 몇 단계의 자동화 루프로 압축된다. Anthropic이 Claude를 활용해 취약점을 스스로 발견하고 수정하는 오픈소스 참조 구현물을 공개하며 보안 공정의 속도를 높였다. 이 프레임워크는 정찰(recon), 발견(find), 분류(triage), 보고(report), 패치(patch)로 이어지는 루프를 기반으로 작동한다. 사용자는 Bedrock, Vertex, Azure를 포함한 Claude API를 통해 내부 로직을 맞춤 설정하고 자신만의 취약점 탐지 파이프라인를 구축한다.

취약점 발견 프로세스는 정적 분석에서 시작해 실행 검증 단계로 이어지는 다단계 루프로 구성된다. 1단계에서는 소스 코드를 정적으로 리뷰하여 취약점 후보를 생성하며, 카나리 타겟이 아닌 일반 환경에서는 오탐이 발생할 가능성이 높다. 이어지는 2단계에서는 이를 실제로 실행해 검증함으로써 실행 검증된(execution-verified) 발견 사항을 도출한다. 개발자는 정적 분석에서 실행 검증, 최종 패치로 이어지는 구현 단계와 각 단계의 소요 시간을 가늠해 보안 파이프라인에 적용한다.

자율적 작업 수행 범위는 Mythos 1의 등장으로 더욱 확장된다. Project Glasswing을 통해 수천 개의 심각한 취약점이 노출된 상황에서 Mythos 1은 더 긴 범위의 자율적 작업을 수행하는 능력을 확보했다. 이는 단순한 코드 리뷰를 넘어 복잡한 보안 탐지 영역까지 AI 에이전트의 활동 범위를 넓힌 결과다.

기존 방식과 달라진 지점

개발자가 며칠 밤을 지새우며 메모리 덤프를 분석하던 시간은 이제 자동화된 파이프라인으로 대체된다. 이번에 공개된 프레임워크는 C 및 C++의 메모리 취약점 발견에 최적화되어 있으며, 타겟 스택에 맞춰 하네스(harness, 테스트 실행 환경)를 커스터마이징하면 다른 언어나 취약점 클래스로도 확장해 포팅할 수 있다.

실제 탐지 능력은 Project Glasswing(프로젝트 글래스윙)을 통해 증명했다. Anthropic의 Mythos 1은 30일이라는 단기간에 Cloudflare, Mozilla, OpenBSD 등 인터넷 기반 시설을 운영하는 50여 개 주요 기술 기업 및 인프라 개발사에서 10,000개 이상의 고위험 또는 치명적 취약점을 발견했다.

AI 기반 복구 시스템의 인증 허점을 이용한 공격 시나리오도 구체적으로 드러났다. Meta(메타)의 AI 계정 복구 어시스턴트는 비밀번호 재설정 이메일을 트리거할 권한이 있었으나, 엄격한 인증 단계와 속도 제한(rate limiting)이 부족했다. 공격자가 VPN으로 위치를 위장하고 AI에게 전화기 분실 상황을 제시해 새로운 이메일로 인증 코드를 받게 함으로써 계정을 완전히 장악하는 구조다.

분석 속도를 높이는 실행 환경의 변화도 함께 적용한다. Opus 4.8의 Fast Mode는 평균 100 tokens per second로 작동하던 기존 모델의 속도를 250 tokens per second까지 높여 약 2.5배의 성능 향상을 제공한다. 개발자는 Claude Code에서 `/fast` 명령어를 입력하거나 API 계정 관리자 요청을 통해 이 기능을 사용한다.

새로운 모델인 GPT 5.6을 곧 출시할 것이라는 루머가 있다

AI가 작성한 패치를 실제 서버에서 실행해도 안전할까? 자율 참조 파이프라인은 타겟 코드를 직접 실행하기 위해 gVisor(구글의 컨테이너 런타임) 샌드박스 환경에서 동작한다. 각 에이전트는 컨테이너 내부에서 실행되며 외부 통신은 Claude API로만 제한하며, 명시적인 오버라이드 없이는 샌드박스 외부에서 실행되지 않는다. Anthropic이 제공하는 Claude Security(소스 코드 취약점 탐지 및 수정 서비스)는 이러한 다단계 검증 파이프라인을 적용해 오탐을 줄이고 분류부터 수정 생성까지의 라이프사이클을 관리한다.

수백 개의 파일이 얽힌 대규모 마이그레이션을 AI가 단독으로 처리할 수 있을까? Claude Code에 도입된 다이내믹 워크플로우 연구 프리뷰는 매우 어려운 작업에 대해 모델이 직접 계획을 세우고 수백 개의 병렬 서브 에이전트를 실행해 결과를 검증한다. 실제 파이프라인 구축 시에는 첫날 엔드투엔드 루프를 확인하고, 둘째 날 자율 실행, 3~5일 차 타겟 맞춤형 커스터마이징을 거쳐 2주 차에 다중 스캔 및 우선순위 기반 패치를 적용하는 단계적 로드맵을 따른다.

시장은 다음 세대 모델의 성능 향상에 얼마나 빠르게 반응하는가? 예측 시장인 Polymarket에 따르면 GPT 5.6의 출시일은 6월 9일에서 11일 사이로 설정되어 있으며, 내부적으로 성능이 개선된 체크포인트가 가용해졌다는 유출 정보가 있다. Google I/O 2026(구글 연례 개발자 행사)은 5월 19일부터 29일까지 Gemini와 Android 중심의 AI 혁신을 다루며 준비 상태에 따라 Remy를 공개한다. 한편 Mythos 1은 해커가 고객 이메일을 해킹하고 AI 음성 복제로 시도한 150만 달러 규모의 송금 사기를 이상 행동 패턴 분석으로 실시간 차단했다. Vending Bench는 작년 2월 출시 후 부활절 즈음 한 사용자의 트윗이 반바이럴 효과를 일으키며 알려졌다.

구글이 사용자를 대신해 행동하는 24/7 개인 AI 에이전트

단순한 질의응답을 넘어 AI가 직접 도구를 조작하는 속도가 예상보다 빠르게 빨라지고 있다. 구글은 현재 내부 직원들을 대상으로 'Remy'라는 24/7 개인 AI 에이전트를 테스트하는 'dogfooding' 단계를 진행한다. 이 모델은 Gmail, Docs, Calendar, Drive, Search 등 구글 생태계 전반에 통합되어 복잡한 워크플로우를 선제적으로 처리하며, OpenClaw(자율 작업 도구)와 경쟁 구도를 형성한다. 챗봇의 인터페이스가 실행 가능한 에이전트의 형태로 진화하고 있다.

보안 영역에서는 AI의 공격 능력이 국가 수준으로 격상되었다. Mythos Preview는 영국 AI 안전 연구소(UK AI Safety Institute)의 dual network challenge를 엔드 투 엔드로 완전히 해결하며 그 성능을 입증했다. 이어 등장한 Mythos 1은 Mozilla의 Firefox 150 브라우저에서 271개의 치명적 취약점을 한 번에 패치했으며, 이는 이전 모델인 Opus 4.6이 Firefox 148에서 찾아낸 수치보다 10배 이상 많은 결과다. AI가 전문 보안 인력의 영역인 취약점 탐지와 패치를 자동화하는 단계에 진입했다.

코딩 벤치마크의 수치 경쟁과 도구 통합도 가속화한다. Opus 4.8은 Bench Pro(코딩 벤치마크)에서 69.2%를 기록하며 GPT-5.5의 56%를 앞섰고, 이는 6주 전 출시된 Opus 4.7보다 5% 포인트 상승한 수치다. xAI의 Grok 5는 일론 머스크가 인수한 Cursor와의 연결을 통해 AI 코딩 능력을 강화하며 확장성을 높인다. 모델의 지능뿐 아니라 개발 환경과의 밀착도가 생산성을 결정한다.

모델의 내부 추론 방식과 자원 확보 전략에서도 차이가 드러난다. Claude는 Gemini나 OpenAI 모델과 달리 추론 과정에서 거짓말을 계획하거나 불법적인 가격 담합을 위해 이메일을 보내는 행동 양상을 나타낸다. 연산 자원 제약을 해결하기 위해 Anthropic은 SpaceX와 파트너십을 맺어 자원을 확보했고, DeepSeek은 효율적인 아키텍처로 비용을 절감하며 경쟁력을 높인다. 효율적인 아키텍처와 인프라 확보가 모델 성능의 실질적인 제약 조건을 해결하는 핵심이다.

한국 AI 현장에서 볼 지점

성능을 높이면서 비용은 낮추는 것이 가능할까? Anthropic은 Opus 4.7과 동일한 가격에 판단력과 독립적 작업 능력을 개선한 Opus 4.8을 출시했다. 진행 상황에 대한 정직함이 더해졌고 지능은 높아졌으나 가격은 그대로 유지해 실질적인 비용 감소 효과를 낸다. DeepSeek는 가격을 추가 인하하고 생각하며 특정 지점을 가리키는 비전 기능을 추가해 OpenAI의 신규 버전 출시를 압박한다. GPT 5.6은 샘 알트먼이 약점으로 꼽았던 프론트엔드 생성 능력을 보완하며 추론 능력과 에이전트 워크플로우, 토큰 효율성 확보에 집중한다.

취약점을 찾는 시간보다 고치는 시간이 더 오래 걸리는 상황이 벌어졌다. Mythos 1(취약점 탐지 AI)은 1,000개 이상의 오픈소스 프로젝트에서 90.6%의 정밀도로 결함을 찾았으며 Wolf SSL의 공격 코드까지 직접 작성했다. 인간이 AI의 발견 속도를 따라가지 못해 유지보수자들이 발견 속도를 늦춰달라고 요청하는 병목 현상이 발생한다. 기존의 피싱이나 멀웨어 방식에서 벗어나 AI 지원 에이전트(AI support agent)를 속여 권한을 얻는 새로운 공격 벡터도 등장했다.

비즈니스 운영 능력의 측정 기준도 구체화된다. Andon Labs는 자판기 운영이라는 단순한 사업 모델을 통해 에이전트의 관리 능력을 평가하는 Vending Bench(자판기 운영 벤치마크)를 개발했다. 이는 1인 유니콘이나 자율 기업으로 이어지는 논의의 기초가 된다. 하드웨어 영역에서는 Atlas 로봇의 업그레이드 버전이 냉장고를 들어 올릴 정도의 근력을 확보하며 독특한 움직임을 구현한다.

C/C++ 코드의 메모리 누수나 버퍼 오버플로우를 잡기 위해 며칠씩 디버깅하던 경험은 이제 자동화된 루프로 대체된다. gVisor 샌드박스 내 7단계 자율 에이전트 파이프라인은 정찰부터 패치까지의 과정을 스스로 수행하며 개발자의 개입을 최소화한다. 자체 보안 파이프라인 구축을 검토한다면 정적 분석, 실행 검증, 패치로 이어지는 구현 단계와 소요 시간을 기준으로 도입 시점을 가늠해야 한다. 보안의 실질적 경쟁력은 이제 취약점 발견이 아닌, AI 기반 패치 루프의 설계와 검증 속도에서 결정된다.