이번 주 엔비디아 내부에서 Codex(코드 작성을 도와주는 AI 에이전트 앱)가 GPT-5.5로 교체되면서, 엔지니어들이 며칠씩 붙잡던 디버깅 작업을 몇 시간 안에 끝내기 시작했다. 엔비디아의 제품, 법무, 마케팅, 재무, 인사 등 전 부서 직원 1만 명이 이 앱을 사용 중이며, 내부에서는 '인생이 바뀌었다'는 반응이 나오고 있다.

GPT-5.5가 Codex에 탑재, 엔비디아 GB200 NVL72에서 구동

OpenAI는 Codex(OpenAI의 에이전트형 코딩 앱)를 최신 모델 GPT-5.5로 업데이트했다고 발표했다. 이 모델은 엔비디아의 GB200 NVL72(랙 단위 AI 시스템)에서 구동된다. 엔비디아에 따르면, GB200 NVL72는 이전 세대 시스템 대비 백만 토큰당 비용이 35배 낮고, 메가와트당 초당 토큰 출력이 50배 높아, 기업 규모에서 최첨단 모델 추론을 실용적으로 만든 경제성을 제공한다.

엔비디아 내부에서는 이미 수 주간 GPT-5.5 기반 Codex를 사용해 왔으며, 측정 가능한 성과가 나왔다. 디버깅 주기가 며칠에서 몇 시간으로 줄었고, 여러 파일에 걸친 복잡한 코드베이스에서 실험에 수 주가 필요했던 작업이 하룻밤 만에 완료되고 있다. 팀들은 자연어 프롬프트로 처음부터 끝까지 기능을 출시하고 있으며, 이전 모델보다 신뢰성이 높고 낭비되는 작업 주기가 적다고 보고되었다.

예전에는 사람이 직접 붙잡고 보던 작업, 이제는 에이전트가 처리

예전에는 엔지니어가 직접 디버깅 로그를 뒤지고, 여러 파일을 오가며 수동으로 수정하던 작업이었다. 이제는 Codex 에이전트가 자연어 명령 하나로 전체 코드베이스를 분석하고 수정 제안까지 내놓는다. 엔비디아는 보안을 위해 모든 직원에게 클라우드 가상 머신(VM)을 제공하여 에이전트가 격리된 샌드박스에서 회사 데이터에 접근하도록 했다. Codex 앱은 원격 SSH(보안 셸, 안전한 원격 접속 프로토콜) 연결을 통해 승인된 클라우드 VM에 접속하며, 데이터 무보존 정책과 읽기 전용 권한으로 운영된다.

OpenAI와 엔비디아의 협력은 2016년, 젠슨 황이 첫 DGX-1 AI 슈퍼컴퓨터를 OpenAI 본사에 직접 전달하면서 시작되었다. 이후 두 회사는 전체 AI 스택에서 긴밀히 협력해 왔다. OpenAI는 엔비디아의 차세대 AI 인프라에 10기가와트 이상의 엔비디아 시스템을 배포하기로 약속했으며, 이는 수백만 개의 엔비디아 GPU를 기반으로 한다. 또한 두 회사는 초기 실리콘 및 공동 설계 파트너로서, OpenAI의 피드백이 엔비디아의 하드웨어 로드맵에 반영되고 OpenAI는 새로운 아키텍처에 조기 접근할 수 있다. 이 협력의 구체적 성과로는 첫 GB200 NVL72 10만 GPU 클러스터의 공동 부팅이 있으며, 이 클러스터는 여러 대규모 학습 실행을 완료하고 시스템 수준 신뢰성의 새로운 기준을 세웠다.

개발자가 바로 체감하는 변화는 추론 비용의 급감이다. GB200 NVL72의 35배 낮은 비용 덕분에, 기업이 GPT-5.5 같은 최첨단 모델을 대규모로 운영하는 것이 현실이 되었다. 엔비디아 내부에서는 이미 1만 명의 직원이 이 에이전트를 통해 생산성 향상을 경험하고 있으며, 이는 AI 에이전트가 단순한 코드 도우미를 넘어 지식 작업 전반으로 확장되고 있음을 보여준다.

AI 에이전트는 이제 인간처럼 각자 전용 컴퓨터가 필요하다는 엔비디아의 접근 방식이 현실에서 검증되고 있다.