지금 개발자 커뮤니티에서는 인공지능이 얼마나 무서운 속도로 똑똑해지고 있는지에 대해 뜨거운 논쟁이 벌어지고 있다. 단순히 코드를 짜주는 수준을 넘어 이제는 전문 해커처럼 시스템의 빈틈을 찾아내 공격하는 수준까지 왔기 때문이다. 도대체 어떤 일이 벌어지고 있기에 다들 긴장하는 것일까.

Anthropic Mythos의 32단계 네트워크 공격 성공

최근 Anthropic이 만든 Mythos라는 거대언어모델(사람처럼 말을 아주 잘하는 인공지능)이 공개되었다. 이 모델은 일반 사람들에게는 공개되지 않고 아주 중요한 소프트웨어를 만드는 소수의 개발자에게만 허락되었다. 그 이유는 Mythos가 가진 해킹 능력이 너무나 강력하기 때문이다.

AI Security Institute(인공지능의 안전성을 테스트하는 기관)가 진행한 실험에서 Mythos는 기업의 네트워크를 공격하는 32단계의 아주 복잡한 시뮬레이션을 수행했다. 결과는 놀라웠다. 10번의 시도 중 3번이나 모든 단계를 완벽하게 통과하며 공격에 성공했다.

이 과정에서 인공지능은 한 번의 시도마다 1억 개의 토큰(인공지능이 글자를 읽고 쓰는 최소 단위)을 사용했다. 돈으로 환산하면 약 12,500달러라는 엄청난 비용이 들어갔다. 흥미로운 점은 인공지능에게 더 많은 토큰을 쓸 수 있게 허락할수록 해킹 성공률이 계속해서 올라갔다는 사실이다. 결국 Mythos는 돈과 자원을 쏟아부으면 웬만한 보안망은 뚫을 수 있다는 것을 증명했다.

보안의 정답이 창의성에서 자원 투입량으로 변화

과거의 보안은 누가 더 기발한 방법으로 구멍을 찾고 막느냐의 싸움이었다. 하지만 이제는 상황이 완전히 달라졌다. 보안의 핵심이 작업증명(컴퓨터가 어려운 문제를 풀어서 정답을 맞힌 것을 증명하는 방식)처럼 변하고 있기 때문이다.

이제 보안은 공격자가 쓴 토큰보다 방어자가 더 많은 토큰을 써서 빈틈을 메워야 이기는 게임이 되었다. 즉 머리싸움이 아니라 누가 더 많은 계산 자원과 돈을 투입하느냐의 싸움으로 바뀐 것이다.

이런 흐름은 최근 LiteLLM(여러 인공지능 모델을 쉽게 연결해 주는 도구)이나 Axios(데이터를 주고받는 통신 도구) 같은 곳에서 발생한 공급망 공격(소프트웨어를 만드는 과정에 몰라 나쁜 코드를 심는 공격) 사건과 맞물려 더 빠르게 확산하고 있다. 개발자들은 이제 다른 사람이 만든 오픈소스(누구나 코드를 보고 고칠 수 있게 공개한 소프트웨어)를 가져다 쓰는 의존성(다른 사람이 만든 코드를 가져다 쓰는 것) 구조가 위험하다고 느끼기 시작했다. 차라리 비용을 더 들여서 인공지능으로 직접 코드를 짜는 것이 더 안전하다는 주장이 힘을 얻고 있다. 결국 보안의 승패는 기술적 아이디어가 아니라 투입되는 자원의 양에 의해 결정된다.

개발에서 리뷰를 넘어 하드닝 단계로의 확장

이런 변화는 실제로 소프트웨어를 만드는 과정까지 바꾸고 있다. 지금까지 개발자들은 기능을 만들고 나서 코드를 검토하는 리뷰 단계를 거쳤다. 하지만 앞으로는 여기에 하드닝(보안 구멍을 찾아내어 단단하게 막는 작업)이라는 세 번째 단계가 필수적으로 추가될 가능성이 크다.

첫 번째 단계에서는 사람이 기능을 구현하고, 두 번째 단계에서는 리팩터링(기능은 그대로 두고 코드 구조만 깔끔하게 정리하는 것)을 통해 품질을 높인다. 그리고 마지막 하드닝 단계에서는 예산이 허락하는 한 최대한 많은 토큰을 투입해 인공지능이 자동으로 취약점을 찾아내고 막게 하는 방식이다.

이제 코드를 작성하는 비용은 매우 저렴해졌지만, 그 코드를 안전하게 만드는 비용은 공격자가 얼마나 많은 자원을 쓰느냐에 따라 계속 올라갈 것이다. 보안을 지키기 위해 공격자보다 더 많은 토큰을 구매해야 하는 시대가 온 셈이다. 소프트웨어 제작 과정은 이제 효율성보다 비용 기반의 자원 경쟁 체제로 진입했다.

보안은 이제 똑똑한 한 명의 천재가 아니라 얼마나 많은 자원을 투입할 수 있느냐의 싸움이 되었다.