AI 에이전트의 자율적 인프라 구축과 비용 발생 사실

이번 사건의 발단은 한 AI 에이전트가 취미 네트워크인 DN42(Decentralized Network 42)에 가입해 네트워크 인덱스를 생성하려 시도하면서 시작됐다. DN42는 BGP(Border Gateway Protocol, 경계 경로 프로토콜)와 재귀적 DNS 등 현대 인터넷 백본 기술을 사용하는 실험적 네트워크다. 해당 에이전트는 네트워크 전체를 스캔하기 위해 운영자의 AWS 계정 권한을 이용해 자율적으로 인프라를 프로비저닝했다.

에이전트가 구축한 인프라의 핵심 수치는 다음과 같다. 에이전트는 AWS의 `m8g.12xlarge` 인스턴스 5대를 배치했으며, 각 인스턴스는 20Gbps의 대역폭을 갖춰 총 100Gbps의 스캔 능력을 확보했다. 에이전트는 이를 통해 매시간 집중적인 네트워크 스캔을 수행하려 했다. 결과적으로 이 과정에서 발생한 AWS 청구 금액은 6,531.30달러에 달했으며, 이는 운영자가 감당할 수 없는 수준의 비용으로 이어져 결국 에이전트 가동 중단으로 끝났다.

네트워크 스캔 메커니즘과 AI의 논리적 오류

에이전트가 설계한 인프라 구조는 공유 애니캐스트(Anycast) IP 뒤에 5대의 인스턴스를 로드 밸런싱 형태로 배치한 구성이다. 각 인스턴스는 BGP 세션을 통해 애니캐스트 접두사를 공고하며, 주소 공간을 분할해 처리하는 방식을 택했다. 이는 일반적인 보안 기업이 전 세계 인터넷을 스캔하는 Shodan이나 Censys와 유사한 고성능 인프라 설계 방식이다.

하지만 에이전트는 대상 네트워크의 특성과 주소 체계에 대한 이해에서 심각한 오류를 보였다. DN42가 사용하는 IPv6 주소 공간인 `fd00::/8` 접두사는 약 $2^{120}$개(약 $1.33 \times 10^{36}$개)의 고유 주소를 포함한다. 에이전트는 초기에는 '전체 포트 네트워크 스캔'을 언급했으나, 커뮤니티가 IPv6 주소 공간의 방대함을 지적하자 뒤늦게 논리를 수정했다. 수정된 논리에 따르면, 도달 가능한 호스트 수를 1,000~2,000개로 가정하고 각 호스트당 65,536개의 포트를 스캔할 때 발생하는 트래픽을 약 7.9GB로 계산했으며, 100Gbps 대역폭으로는 이를 5분 이내에 완료할 수 있다고 주장했다.

또한, 에이전트는 커뮤니티와의 상호작용 과정에서 존재하지 않는 개념을 만들어내는 환각(Hallucination) 현상을 보였다. DN42 노드에 '색상(Color)'이 할당된다거나, IRC 리뷰 프로세스를 통해 '행복도 레벨(Happiness Level)'을 결정한다는 가상의 가이드라인을 생성해 배포하는 등 기술적 사실과 무관한 내용을 사실처럼 제시했다.

실무적 관점에서의 리스크 관리와 제어권 설정

개발자와 시스템 운영자가 이번 사례에서 주목해야 할 지점은 AI 에이전트에게 부여된 자원 할당 권한과 '검토 없는 승인'의 위험성이다. 에이전트는 목표 달성을 위해 '최적'이라고 판단되는 고성능 인프라를 선택했지만, 이는 취미 네트워크라는 환경적 맥락을 무시한 과잉 설계였다. 특히 운영자가 에이전트의 세부 계획을 검토하지 않고 "지체 없이 즉시 완료하라(immediately without delay)"는 지시만 반복한 것이 비용 폭증의 직접적인 원인이 됐다.

실무적으로 AI 에이전트를 클라우드 인프라와 연결할 때는 다음과 같은 제약 사항을 강제해야 한다. 첫째, API 키의 권한을 최소화하여 특정 인스턴스 유형이나 최대 대역폭을 제한하는 '제한된 AWS 키'를 사용해야 한다. 둘째, 자원 생성 시 비용 임계치(Budget Alert)를 설정하고, 특정 금액 초과 시 즉시 프로비저닝 권한을 차단하는 서킷 브레이커 메커니즘이 필요하다.

결국 AI 에이전트는 주어진 목표를 달성하기 위한 수단(인프라 규모)을 결정할 때 비용 효율성이나 환경적 적절성을 스스로 판단하지 못한다. 따라서 인프라 설계 단계에서는 AI의 제안을 그대로 수용하는 것이 아니라, 입력값과 처리 방식, 그리고 예상 비용에 대한 인간의 명확한 검증 단계가 필수적이다.