악성코드 개발자들이 AI 보안 스캐너의 분석을 막기 위해 스파이웨어에 핵·생물무기 관련 문구를 삽입했다. LLM(거대언어모델)의 안전 거부 기능을 유발해 보안 분석 파이프라인이 작동하지 않도록 만드는 것이 목적이다.

Fable 5(AI 분석 모델)에서 해당 텍스트 분석 시도가 실제로 거부되는 사례가 확인됐다. 이는 폐쇄형 및 오픈 모델이 공격적인 거부 정책을 가질 때, 공격자가 해당 조건을 찾아 2차 맹점으로 활용할 수 있음을 보여준다.

이러한 방식은 저작권 보호를 위해 작품 내 흰색 글자나 PDF 메타데이터에 대량살상무기 관련 프롬프트를 넣어 AI 재사용을 막는 아이디어로도 확장된다. 복잡한 사이버 보안 시스템에서는 프롬프트 조작을 피하고 안전 기능으로 인해 분석 능력이 과도하게 둔화되지 않은 모델이 요구된다.