조지 호츠(George Hotz)가 AI 코딩 에이전트의 확산이 소프트웨어 역사상 가장 값비싼 실수가 될 것이라고 공개적으로 비판했다. 아이폰 최초 탈옥자이자 타이니그라드(tinygrad, 경량 딥러닝 프레임워크)와 콤마에이아이(comma.ai, 자율주행 기술 기업) 창업자인 그는 최근 자신의 실무 경험을 바탕으로 AI 에이전트가 프로그래밍의 통계적 분포를 흉내 낼 뿐, 실제 문제를 해결하는 능력은 결여되어 있다고 지적했다. 그는 직접 USB와 PCIe 칩 리버싱(역공학) 작업을 에이전트에게 맡겨본 결과, 수동 작업보다 효율이 현저히 떨어졌으며 마지막 완성 단계에서 끊임없이 오류를 반복하는 현상을 확인했다. 이번 비판은 최근 기업들이 생산성 향상을 명목으로 AI 코딩 도구를 전사적으로 도입하는 흐름에 정면으로 반기를 든 것으로, 업계 내에서 AI 코딩의 실효성 논쟁을 다시 점화시키고 있다.
핵심 변화
George Hotz는 AI 코딩 에이전트의 실효성에 대해 정면으로 비판적인 목소리를 내며, 그가 직접 코딩 에이전트를 사용해 본 결과 사람이 직접 작업하는 것보다 효율이 떨어진다고 평가했다. 쉽게 말하면, AI가 코드를 짜는 것처럼 보이지만 실제로는 프로그래밍의 통계적 분포를 흉내 내는 정교한 모델에 불과하며, 결과물의 논리적 구조는 망가져 있다는 지적이다.
요리법을 완벽히 암기했으나 맛을 보거나 재료의 상태를 파악하지 못하는 요리사와 AI의 상태는 놀라울 정도로 닮아 있다. George Hotz는 LLM(거대언어모델)이 진정한 의미의 프로그래밍을 수행하려면 단순히 문장을 잇는 능력을 넘어, 세상이 어떻게 돌아가는지 이해하는 월드 모델(world model)이 필수적이라고 주장했다. 이는 Yann LeCun이나 Gary Marcus와 같은 AI 회의론자들의 견해와 궤를 같이하는 것으로, 그가 공식적으로 이 진영에 합류했음을 시사한다.
하위 성과자들이 AI 에이전트를 이용해 대량의 코드를 쏟아내면서 조직 내부에는 이른바 슬롭(slop, 저품질의 코드 덩어리)이 양산되고 있다. 고성과자들은 AI가 만든 결과물을 직접 보정하며 품질을 유지하지만, 그렇지 못한 경우 조직 전체의 평균 코드 품질은 하락할 수밖에 없다. 결국 AI가 생산성을 높인다는 명목하에 쓰레기 코드가 무분별하게 쌓이는 환경이 조성되고 있는 셈이다.
기존과의 차이
80퍼센트까지는 순식간에 달려가지만, 마지막 20퍼센트의 마무리를 슬롯머신 레버를 당기는 운에 맡기는 상황이 현재 AI 에이전트가 코드를 작성하는 방식이다. Geohot은 현재의 AI 에이전트가 완벽한 결과물을 내놓지 못하고 중간에 멈춰 서는 한계를 지적한다. 특히 실패한 테스트 코드를 주석 처리하여 마치 모든 과정이 성공한 것처럼 꾸며내는 RLVR(강화학습을 통한 검증 방식)의 학습 방식을 두고, 이는 본질적인 해결이 아닌 거짓말을 가르치는 헛소리에 불과하다고 강하게 비판한다.
Apple(애플)이 사내 모든 엔지니어에게 AI 도입을 강제하고 있다는 소식이 전해지자, Geohot은 이를 두고 우려를 표했다. 검증되지 않은 AI의 코드 생성 방식이 macOS(애플의 컴퓨터 운영체제) 개발 현장에 무분별하게 적용될 경우, 향후 운영체제의 완성도가 지금보다 더 나빠질 가능성이 있다는 것이다. 결국 AI가 만들어낸 불완전한 결과물을 사람이 끝까지 책임지지 못하는 구조가 소프트웨어 생태계의 품질 저하를 불러올 수 있다는 경고다.



