AI가 단순히 대답만 하는 시대를 넘어섰다. 이제는 스스로 파일을 열고 코드를 고치며 복잡한 일을 끝마치는 단계로 가고 있다. 무엇이 AI를 단순한 채팅창 밖으로 끌어냈을까.

OpenAI Agents SDK와 샌드박스 환경

OpenAI가 Agents SDK(AI 비서가 도구를 쉽게 쓰게 돕는 개발 도구)를 업데이트했다. 이제 AI 비서는 샌드박스(컴퓨터 안에 만든 안전한 가상 방)에서 직접 명령을 내리고 파일을 수정한다. Cloudflare(인터넷 연결을 빠르고 안전하게 돕는 서비스)나 Vercel(웹사이트를 쉽게 만들고 올리는 도구) 같은 외부 서비스와도 바로 연결된다. MCP(AI가 외부 데이터에 쉽게 접근하게 돕는 약속)를 통해 다양한 도구를 사용할 수 있다. skills(AI가 단계적으로 능력을 배우게 하는 기능)를 통해 더 복잡한 일도 처리한다. AGENTS.md(AI 비서에게 주는 특별한 지침서)를 통해 맞춤형 명령을 내릴 수도 있다. shell(컴퓨터에 직접 명령어를 입력하는 창)과 apply patch(파일의 특정 부분만 골라 수정하는 기능) 같은 도구도 기본으로 들어갔다. AI가 일할 수 있는 똑같은 방식의 작업실이 완성된 셈이다.

개발 환경의 변화와 실행 안정성

기존에는 AI 비서를 만드는 세 가지 방법이 있었다. 첫째는 아무 모델이나 쓸 수 있는 도구였다. 유연하지만 AI의 능력을 100% 쓰지 못했다. 둘째는 특정 회사에서 만든 도구였다. 성능은 좋았지만 내부가 어떻게 돌아가는지 알기 어려웠다. 셋째는 다 만들어진 서비스를 빌려 쓰는 방식이었다. 편했지만 내 마음대로 고치거나 중요한 데이터를 다루기 힘들었다. 이번 업데이트는 이 세 가지의 장점만 모았다. 뇌에 해당하는 모델과 몸에 해당하는 실행 환경을 분리했기 때문이다. 덕분에 AI 비서가 중간에 멈춰도 스냅샷(특정 시점의 상태를 사진 찍듯 저장하는 기능)을 통해 다시 시작할 수 있다. 여러 개의 가상 방을 동시에 사용해 일을 더 빨리 끝낼 수도 있다. 개발자는 이제 작업 환경을 만드는 단순 노동에서 벗어나 AI 비서가 어떤 일을 할지 설계하는 데만 집중하게 된다. AI의 실행 능력이 통일되며 서비스 출시 속도가 엄청나게 빨라진다.

Oscar Health의 실무 적용 사례

실제 사례가 나왔다. Oscar Health(미국의 건강보험 회사)는 이 도구로 환자의 진료 기록을 정리하는 일을 자동화했다. 단순한 정보 추출이 아니라 복잡한 의료 기록의 흐름을 정확히 짚어내는 작업이다. 이전에는 불안정해서 실제 서비스에 적용하기 어려웠으나 이제는 가능하다. 이 기능은 API(프로그램끼리 서로 대화하는 통로)를 통해 모든 고객이 바로 사용할 수 있다. 사용한 만큼 돈을 내는 방식으로 운영된다. Python(컴퓨터에게 명령을 내리는 쉬운 언어)에서 먼저 출시되었고 TypeScript(웹사이트를 만들 때 쓰는 정교한 언어) 지원도 추가될 예정이다. AI 비서가 전문적인 영역의 실무를 안정적으로 처리하기 시작했다.

AI는 이제 말하는 도구에서 일하는 도구로 변하고 있다. 소프트웨어를 만드는 방식 자체가 통째로 바뀔 것이다.