발표에서 확인된 핵심 사실

소프트웨어 업데이트 알림이 뜰 때마다 미루거나 보안 패치 과정을 귀찮게 여기는 일이 잦다. 하지만 이런 작은 빈틈을 이용해 기기를 옮겨갈 때마다 공격 전략을 스스로 수정하는 AI 웜(worm, 스스로 복제해 전파되는 악성코드)이 구현됐다. 토론토 대학교 연구진은 공개 AI 모델을 활용해 네트워크 전체를 장악하며 확산되는 새로운 사이버 위협의 위험성을 입증했다.

이 웜은 누구나 접근 가능한 무료 AI 모델을 통해 구축된다. 해커는 큰 비용을 들이지 않고도 정교한 공격을 수행할 수 있으며, 감염된 장치의 컴퓨팅 파워를 하이재킹(hijacking, 권한 탈취)해 다음 공격을 위한 추론 동력으로 사용한다. 공격자가 직접 개입하지 않아도 AI가 스스로 최적의 경로를 찾아 전파되는 구조다.

공격 대상은 일반적인 노트북과 카메라를 넘어 HVAC(냉난방공조) 시스템과 에너지 그리드 등 인터넷에 연결된 모든 장치로 확대된다. 기존 연구들이 주로 AI 애플리케이션 내부에서 확산되는 방식에 주목했다면, 이번 프로토타입은 AI 시스템 외부의 기본 소프트웨어를 직접 공격한다. 이로 인해 AI 기능을 쓰지 않는 일반 장치들까지 광범위한 위험에 노출된다.

기존의 보안 체계는 미리 정의된 고정 스크립트를 기반으로 위협을 탐지하고 방어한다. 하지만 실시간으로 공격 전략을 적응시키는 AI 웜 앞에서는 이러한 정적 방어 방식이 무력해질 수 있다. 고정된 규칙이 아니라 변화하는 패턴에 대응해야 하는 새로운 방어 기준이 필요해진 시점이다.

AI 웜은 각 타겟을 분석해 맞춤형 공격을 수행하고, 감염된

매번 뜨는 소프트웨어 업데이트 알림과 보안 패치 설치의 번거로움을 단순히 귀찮은 일로만 여겨야 할까. 연구진은 누구나 다운로드하고 수정할 수 있는 오픈 웨이트(open-weight, 모델의 가중치가 공개된 형태) AI 모델을 이용해 기기를 옮겨갈 때마다 공격 전략을 스스로 수정하는 AI 웜을 구현했다. 이 웜은 네트워크 깊숙이 침투해 각 타겟의 비밀번호와 취약점을 수집하고, 분석한 정보를 바탕으로 맞춤형 공격을 수행한 뒤 다음 기기로 자신을 복제한다.

공격의 동력은 감염된 기기 자체에서 확보한다. AI 웜은 장악한 기기의 프로세싱 파워(Compute, 연산 능력)를 빨아들여 자신의 추론 과정과 다음 공격을 위한 연료로 사용한다. 외부 서버의 도움 없이 감염된 기기들의 자원을 엮어 확산 속도를 높이는 구조다. 이 과정에서 새로운 기기를 감염시키는 데 드는 비용은 사실상 제로가 된다.

위험은 고성능 모델뿐만 아니라 소규모 모델에서도 발견된다. 연구진은 안전 가드레일(Safety guardrails, AI의 유해 응답을 제한하는 장치)을 제거하고 조작한 소규모 오픈 웨이트 모델이 실제적인 피해를 입힐 수 있음을 입증했다. 소규모 모델은 위험하지 않다는 일반적인 가정을 뒤집는 결과다. 기술적 지식만 있다면 누구나 무료로 모델을 다운로드해 공격 도구로 바꿀 수 있다.

기존의 방어 체계는 미리 정의된 고정 스크립트를 기반으로 이상 징후를 탐지하고 차단한다. 하지만 AI가 실시간으로 적응하며 공격 경로를 수정하면 기존의 탐지 규칙은 무력해질 가능성이 크다. 정적인 방어벽이 실시간으로 진화하는 적응형 공격자를 따라잡지 못하는 상황이 구체적인 위협으로 다가온 것이다.

기술이 실제로 작동하는 방식

대부분의 사용자는 소프트웨어 업데이트 알림을 알려진 보안 구멍을 메우는 번거로운 작업으로 여긴다. 하지만 기존의 웜은 사람이 미리 작성한 고정된 스크립트에 따라 작동했기에, 프로그래밍되지 않은 방어벽을 만나면 그대로 작동을 멈췄다. AI 웜은 실시간으로 학습하고 계산하며 공격 전략을 변경하는 방식으로 움직인다. 시스템 전체로 확산하는 과정에서 각 장치가 가진 알려진 취약점을 실시간으로 이용해 공격 경로를 바꾸는 피벗(pivot)을 수행한다. 전통적인 공격이 정해진 경로만을 따라갔다면, AI 웜은 스스로 판단하여 최적의 침투 경로를 찾아낸다. 이러한 적응력 덕분에 AI 웜은 사람이 개입하지 않고도 스스로 방어벽의 틈을 찾아내어 파고든다. 정해진 규칙 없이 상황에 맞춰 적응하기 때문에, 기존의 단일한 방어 체계만으로는 실시간으로 진화하는 공격을 완전히 차단하기 어렵다.

Nicolas Papernot 교수와 CleverHans Lab(클레버한스 랩) 연구진은 외부 세계와 완전히 격리된 보안 디지털 랩에서 이번 연구를 수행했다. 악의적인 행위자가 AI 웜의 작동 원리를 먼저 발견해 실제 공격에 악용하기 전에 위협의 실체를 정확히 이해하려는 목적이다. 연구진은 분석 결과를 일반에 공개하기 전 국가 안보 기관 및 과학, 국방 관련 기구들과 긴밀히 협의하며 책임감 있는 공개 방안을 모색했다. 단순한 기술 증명을 넘어 국가 안보 차원의 대응책을 마련하기 위해 전문 기구의 조언을 구한 것이다. 특히 실제 위협 행위자가 공격 도구로 활용할 수 있는 구체적인 기술 정보는 정밀 검토 과정을 통해 모두 제거했다. 공격 기술의 무분별한 확산을 막고 방어 전략을 먼저 수립하기 위해 연구 단계부터 안전장치를 마련한 결과다.

소프트웨어 업데이트 알림을 미루는 일상의 번거로움은 이제 치명적인 진입점이 된다. 공개 AI 모델을 활용해 기기별로 공격 전략을 수정하고, 감염된 기기의 컴퓨팅 파워를 탈취해 추론 동력으로 사용하는 AI 웜이 실제로 구현되었기 때문이다.

정해진 규칙대로 작동하는 기존의 스크립트 기반 방어 체계는 실시간 적응형 공격을 막아낼 수 없다. 결국 정적인 방어벽으로는 실시간으로 추론하고 진화하는 AI 웜의 적응력을 따라잡을 수 없다.