요즘 개발자 커뮤니티에서는 AI가 코드를 순식간에 짜주는 모습에 다들 감탄하고 있다. 예전에는 며칠 걸릴 일을 몇 분 만에 끝내는 마법 같은 일이 벌어지고 있기 때문이다. 그런데 정말로 일이 빨리 끝난 것이 맞을까.

AI 코드 도구 사용량과 실제 결과의 차이

최근 개발자들 사이에서는 토큰(AI가 글자를 처리하는 기본 단위)을 얼마나 많이 쓰느냐가 일종의 능력처럼 여겨지고 있다. Claude Code(AI가 코드를 직접 짜고 수정하는 도구), Cursor(AI가 내장된 코드 편집기), Codex(AI가 코드를 생성하는 모델) 같은 도구들을 쓰면 코드가 쏟아져 나오기 때문이다.

하지만 Waydev(개발자가 일을 어떻게 하는지 분석하는 도구)의 데이터를 보면 이상한 점이 발견된다. 처음에는 AI가 짠 코드의 80%에서 90%를 개발자가 그대로 사용한다. 그런데 몇 주가 지나면 그 코드의 상당 부분을 다시 지우고 고치는 일이 벌어진다. 결국 실제로 살아남는 코드는 10%에서 30%밖에 안 된다는 분석이다. 겉으로는 일이 빨리 끝난 것처럼 보이지만 실제로는 다시 고쳐야 할 일이 산더미처럼 쌓인 셈이다.

861%나 급증한 코드 수정률의 비밀

단순히 코드를 많이 만드는 것이 왜 위험한지 숫자가 말해주고 있다. GitClear(코드의 변화를 추적하는 도구)의 보고서에 따르면 AI를 자주 쓰는 개발자는 그렇지 않은 사람보다 코드를 다시 고치는 비율이 9.4배나 높았다. AI가 준 도움보다 고쳐야 할 일이 더 많아진 것이다.

Faros AI(코드의 품질을 분석하는 도구)의 조사 결과는 더 놀랍다. AI를 많이 도입한 곳에서 코드를 지우고 다시 쓰는 비율이 861%나 늘어났다. Jellyfish(AI 개발 팀의 효율성을 측정하는 도구)는 AI 사용 비용을 10배나 더 썼는데 정작 일 처리 속도는 2배밖에 안 빨라졌다는 사실을 찾아냈다. 돈과 에너지를 엄청나게 쏟아부었지만 정작 얻은 결과물은 기대보다 훨씬 적었다는 뜻이다.

초보 개발자가 겪는 AI의 함정

이런 현상은 특히 경험이 적은 주니어 개발자(이제 막 일을 시작한 초보 개발자)에게서 심하게 나타난다. 숙련된 시니어 개발자(경험이 많은 베테랑 개발자)는 AI가 짠 코드의 허점을 금방 찾아내어 조심스럽게 사용한다. 반면 초보자들은 AI가 준 답이 정답이라고 믿고 그대로 사용하는 경우가 많다.

결국 나중에 이 코드가 문제를 일으키면 다시 전부 뜯어고쳐야 하는 상황이 온다. 이 과정에서 기술 부채(당장 빠르게 만들기 위해 대충 짜서 나중에 고쳐야 할 숙제 같은 코드)가 빠르게 쌓인다. AI가 코드를 짜주는 속도는 빨라졌지만 그것을 검토하고 관리하는 사람의 부담은 오히려 더 커진 상태다.

AI는 이제 뗄 수 없는 도구가 되었지만 무조건 많이 쓴다고 좋은 것은 아니다. 이제는 얼마나 많이 짰느냐가 아니라 얼마나 제대로 짰느냐를 고민해야 할 때다.