프롬프트만으로 웹사이트를 제작하고 배포할 수 있는 Sites

기존 개발 프로세스는 정교한 로직 구현에 집중했으나, 서버 설정과 배포 환경 구축이라는 인프라 작업이 서비스 출시의 병목이었다. OpenAI가 프롬프트만으로 웹사이트를 제작하고 배포하는 Sites 플러그인을 공개했다. @Sites 호출만으로 신규 사이트, 대시보드, 내부 도구를 즉시 제작하고 기존 프로젝트를 배포할 수 있다. 별도의 배포 워크플로 없이 웹 앱과 게임의 생성, 저장, 점검을 한 번에 처리한다.

게시 프로세스는 버전 저장과 버전 배포의 두 단계로 나눈다. 검토 가능한 후보 버전을 먼저 생성한 뒤, 승인된 버전만 최종 배포하여 안정성을 확보했다.

Abacus AI의 AI Supercomputer는 AI 에이전트가 소프트웨어를 직접 구축하고 호스팅하는 환경을 구현했다. 데이터베이스 연결, HTTPS 노출, 공용 URL 제공까지 수행하는 인프라 계층을 제공하며, Abacus AI CLI와 OpenAI Codex(GPT 5.5), Claude code(Sonnet 4.6 및 Opus 4.7), Google Antigravity(Gemini 3.5 Flash) 등 서로 다른 모델 기반 에이전트들이 파일 시스템과 터미널을 공유하며 협업한다.

2026년 초부터는 Claude Code, Codeex, Opus 4.5, GPT52 같은 모델의 등장으로 에이전트가 생성한 코드를 실제 프로덕션 환경에 직접 적용하는 사례가 늘어난다. 일반 지식 노동자 역시 Openclaw, Hermes를 활용해 복잡한 에이전트 시스템을 직접 구축하며 서비스 구현의 진입장벽을 낮추고 있다. 이러한 배포 자동화는 단순한 웹사이트 제작을 넘어, 실시간 데이터 처리와 복잡한 추론이 필요한 에이전트 시스템의 상용화로 이어진다.

기존 방식과 달라진 지점

모델의 실제 수익성을 검증하기 위해 Claude Opus 4.7와 Codex 5.5를 대상으로 Polymarket 내 비트코인(BTC) 트레이딩 실험을 진행했다. 5분 단위 거래를 1시간 동안 수행하며 동일한 프롬프트와 문서를 제공해 최종 수익금이 가장 많은 모델을 승자로 결정하는 방식이다.

이미지 인코더를 별도로 붙이는 기존 방식은 좌표 인식에 한계가 있다. M3(MiniMax의 멀티모달 모델)는 100조 개 이상의 토큰을 사전 학습해 텍스트와 이미지 표현을 동일 공간에 배치함으로써 이미지 내 좌표를 직접 추론해 빈 폼의 적절한 위치에 값을 채울 수 있다. 가격은 50% 할인 프로모션 적용 시 입력 100만 토큰당 0.3달러, 출력 1.2달러이며 20달러 구독 시 월 약 17억 개의 M3 토큰을 제공한다.

Sites는 Cloudflare Worker(서버리스 플랫폼) 호환 ES 모듈로 빌드한 프로젝트를 호스팅하여 서버 설정과 DB 구축 공수를 줄였다. 구조화된 데이터는 관계형 DB인 D1에 저장하고 이미지나 비디오 같은 파일 업로드는 객체 스토리지 R2를 활용한다.

자체 클라우드 환경에서 모델을 실행하는 프라이빗 AI를 구현하면 제3자 API 호출 없이 데이터를 직접 제어하고 토큰당 비용 문제를 해결할 수 있다. Anthropic은 최근 6,500만 달러 규모의 펀드레이징을 마쳐 기업 가치가 1조 달러 수준에 근접했다. 권한 관리는 API 키 방식 대신 OAuth나 OIDC를 통해 샌드박스 내에서 처리하며, Abacus AI는 AES 256 암호화와 GDPR 및 SOC 2 컨트롤을 적용해 보안성을 확보했다.

기술이 실제로 작동하는 방식

MiniMax가 출시한 오픈 웨이트 모델 M3는 하드웨어 활용도를 7.6%에서 71.3%까지 끌어올렸으며, 코딩 에이전트 워크플로우와 100만 토큰 컨텍스트 윈도우를 단일 모델에 결합했다. ICLR 2025 논문을 재현하고 Post-train bench에서 Opus 4.7과 GPT-5.5에 이어 3위를 기록하며 수천 단계의 작업을 수행하는 롱 호라이즌 일관성을 확보했다.

실시간 트레이딩 환경에서는 메인 에이전트와 서브 에이전트가 하트비트(상태 모니터링) 체계로 작동한다. 서브 에이전트는 OpenAI의 GPT 5.4 mini 모델을 사용하여 웹소켓 기반의 하드 데이터 파이프라인을 처리하고, 마이닝한 데이터를 메인 모델인 Codex에 전달한다. 메인 에이전트는 이를 바탕으로 30초마다 포지션 의사결정을 내려 토큰 소모를 줄이고 운영 효율을 높였다.

단일 프롬프트로 Django 기반의 엔터프라이즈 CRM을 구축해 mycrm.abacus.cloud에 배포한 사례가 있다. 이 앱은 PostgreSQL, Gunicorn, Nginx 스택을 사용하여 라이브 서버로 작동한다. 현재 이 기능은 ChatGPT Business와 관리자 RBAC를 통해 활성화되는 Enterprise 워크스페이스에서 프리뷰로 제공되며, 외부 ID 프로바이더(IDP) 인증과 세 가지 접근 모드를 지원한다.

최근 미국 기업들이 AI 도입 비용에 놀라는 스티커 쇼크(Sticker Shock) 현상이 Axios의 보도를 통해 나타났다. 이에 따라 기업들은 무제한 성장보다 비용 제약과 효율성을 최우선으로 고려하는 단계로 진입했다.

현장에서 달라지는 비용과 판단

OpenAI와 Anthropic은 핵심 경제 단위를 시트(Seat)에서 토큰(Token)으로 전환했다. 매출 구조를 사용자 수 기반의 유료 시트 전환율이 아니라 API를 통한 실제 토큰 소비량으로 변경해 매출 성장을 가속하고 있다.

Tailscale은 WireGuard를 기반으로 인증(authN)과 인가(authZ)를 네트워크 레벨인 tailnet에 배치해 보안 설정을 단순화했다. 연결 시 사용자, 그룹, 태그 등의 정체성 정보를 함께 전달해 접근을 거버넌스하며, 네트워크 자체를 제어 환경으로 활용한다.

Codex 5.5는 USD BTC 실시간 가격과 Chainlink의 시작/종료 가격을 모니터링해 Polymarket의 센티먼트를 예측한다. 메인 에이전트는 30초마다 서브 에이전트가 생성한 JSON 다이제스트를 입력받아 최종 거래를 결정하며, 30분 내 1달러 수익 같은 구체적인 목표를 설정해 리스크를 조정한다.

Sites는 호스팅 환경 변수와 시크릿을 소스 코드나 설정 파일이 아닌 전용 패널에서 별도로 관리한다. `.openai/hosting.json`이나 소스 커밋에 정보를 저장하지 않고 `.env` 또는 `.env.example`을 사용해 보안 사고를 방지한다.

한국 AI 현장에서 볼 지점

OpenAI는 연간 반복 매출(ARR) 300억 달러를 달성했고, Anthropic은 연간 매출 실행률(annualized run rate) 기준 470억 달러까지 성장했다. Anthropic은 주요 파운데이션 모델 랩 중 최초로 이번 분기 흑자 달성을 예상하며, RAMP 통계에서도 OpenAI보다 빠른 비즈니스 채택 속도를 기록했다.

오픈 웨이트 모델의 실질적 성능이 상승하고 있다. M3는 Browser comp 벤치마크에서 83.5%를 기록하며 Opus 4.7의 79.3%를 앞섰고, Software Engineering Bench Pro에서는 59%의 성적으로 GPT 5.5와 Gemini 3.1 pro를 넘어섰다.

운영 비용 절감을 위해 Better DB(시맨틱 캐싱 데이터베이스)를 적용하면 OpenAI API 호출 시 1,300 토큰이 소모되던 요청을 214 토큰까지 줄일 수 있다. 인프라 구축은 AI Supercomputer가 해결하며, Ubuntu Linux 기반 환경에 2 vCPUs, 8 GB RAM, 내장 SQL 데이터베이스와 S3 호환 스토리지를 제공하고 abacus.ai.cloud를 통해 원클릭 HTTPS 배포를 지원한다.

실제 자금 운용 전략에서 Claude Opus 4.7는 매우 보수적인 매매 방식을 택했다. 5분 윈도우 종료 직전, 가격이 80센트처럼 1달러 미만으로 거래되는 시점에 매수해 수익을 확보하는 등 모델이 승률을 높이는 전술적 판단을 수행했다.

AI로 코딩은 쉬워졌지만 서버 설정과 배포 환경을 구축하는 과정은 여전히 번거로운 영역으로 남았다. OpenAI가 @Sites 호출만으로 웹 앱을 즉시 배포하는 'Sites' 플러그인을 공개하며 이 병목이 사라진다. Cloudflare Worker ES 모듈과 D1 관계형 DB, R2 객체 스토리지를 통합한 서버리스 아키텍처가 인프라의 복잡성을 완전히 제거한다. 이제 핵심은 인프라 구축 능력이 아니라, 프롬프트만으로 내부 도구와 프로토타입을 즉시 서비스화하여 검증하는 판단 속도에 있다. 인프라 설정이 자동화되면서 개발자는 구현 단계 없이 프롬프트만으로 즉시 배포하고 검증할 수 있게 됐다.