AI가 이제는 사람이 몇 시간 동안 해야 할 복잡한 일을 스스로 처리하기 시작했다. 예전에는 몇 초면 끝날 간단한 일만 할 수 있었지만 이제는 훨씬 긴 시간의 작업도 해낸다. 사람들은 AI가 곧 사람의 하루치 업무, 혹은 일주일치 업무를 통째로 대신할 것이라고 기대한다. 하지만 여기서 놓치고 있는 중요한 질문이 하나 있다. 과연 AI가 이 일을 처리하는 데 드는 돈은 얼마나 될까.

METR(AI의 능력을 측정하는 단체)이 밝힌 성능과 비용의 수치

최근 7년 동안 AI의 능력은 눈덩이처럼 빠르게 성장했다. OpenAI가 예전에 만든 초기 AI 모델인 GPT-2는 아주 짧은 시간의 작업만 가능했다. 반면 최신 모델들은 사람이 몇 시간 동안 매달려야 하는 일을 50%의 확률로 성공시킨다. 주목할 점은 이 성능을 올리기 위해 들어간 비용이다. AI 모델의 크기, 즉 AI가 공부한 정보의 양은 4,000배나 커졌다. 또한 AI가 글자를 읽고 쓰는 최소 단위인 토큰(Tokens)의 사용량은 약 10만 배나 늘어났다.

성능이 좋아진 만큼 돈이 더 많이 들어간 셈이다. AI 연구자들이 효율적인 방법을 찾아냈음에도 불구하고 전체적인 비용은 계속해서 가파르게 상승했다. 결국 AI가 더 어려운 일을 하게 된 배경에는 엄청난 양의 계산 자원과 돈이 투입되었다는 사실이 숨어 있다. 현재의 성능 향상은 순수한 지능의 발전이라기보다 막대한 자본을 쏟아부은 결과일 가능성이 크다.

사람의 직선 비용과 AI의 멈춰버린 곡선

사람과 AI의 비용 구조를 비교하면 흥미로운 차이가 나타난다. 사람은 1시간 일을 할 때보다 8시간 일을 할 때 정확히 8배의 임금을 받는다. 비용이 시간에 따라 일정하게 늘어나는 직선 모양을 그린다. 반면 AI는 다르다. AI에게 더 많은 계산 자원을 주고 돈을 더 많이 쓰게 해도 어느 순간부터는 성능이 더 이상 오르지 않는 구간이 나타난다. 이를 돈을 더 써도 실력이 잘 안 느는 현상이라고 한다.

이런 현상은 AI가 효율적인 도구가 되는 데 큰 걸림돌이 된다. 만약 AI가 작업 시간을 3배 늘리는 동안 비용도 3배 늘어난다면 사람과 비슷한 수준을 유지하는 것이다. 그러나 비용이 성능보다 더 빠르게 늘어난다면 상황은 달라진다. 최첨단 AI가 아주 어려운 일을 해낼 수는 있겠지만 그 비용이 사람을 고용하는 것보다 훨씬 비싸질 수 있기 때문이다. 결국 성능 수치만 보고 AI가 사람을 대체할 것이라고 믿는 것은 위험한 생각이다.

실무에서 겪게 될 포뮬러 1의 역설

이런 상황이 계속되면 AI는 포뮬러 1(세계에서 가장 빠른 자동차 경주 대회) 자동차처럼 변할 가능성이 크다. 포뮬러 1 자동차는 세상에서 가장 빠르지만 너무 비싸고 관리가 어려워 일반인이 도로에서 탈 수는 없다. AI 에이전트 스캐폴드(AI가 일을 더 잘하도록 도와주는 보조 도구)를 사용해 억지로 성능을 끌어올려도 실제 돈을 지불하고 써야 하는 기업 입장에서는 배보다 배꼽이 더 큰 상황이 벌어진다.

중요한 것은 AI가 몇 시간을 버티느냐가 아니라 시간당 비용이 얼마냐는 점이다. 예를 들어 AI가 사람의 2시간치 업무를 성공시켰는데 그 비용이 수백 달러라면 아무도 그 AI를 쓰지 않을 것이다. 현재 많은 사람이 AI의 시간당 단가가 얼마인지 정확히 모르고 있다. 단순히 성능이 좋아졌다는 말에 속아 경제성을 무시하고 있는 셈이다. 실질적인 가치는 성능의 정점이 아니라 비용 대비 효율에서 결정된다.

이제는 AI가 얼마나 똑똑한지가 아니라 얼마나 저렴하게 일을 끝내는지에 집중해야 한다.