Google가 Antigravity 2.0과 Gemini 3.5 Flash를 전격 공개했다. Antigravity 2.0은 기존의 VS Code 기반 IDE 형태를 벗어나 계획, 실행, 미리보기를 통합한 에이전트 중심의 데스크톱 앱이다. 이 모델은 OpenSCAD(코드 기반 3D 모델링 도구)를 활용해 로마 판테온을 구현하는 건축 3D LLM 벤치마크에서 가장 높은 품질 점수를 기록했다.
단순한 이미지 모사를 넘어 실제 판테온의 건축 파라미터를 검색해 설계에 반영하는 능력이 확인됐다. 특히 다른 자율 에이전트들이 구현하지 못한 천장의 격자 구조(Coffer)와 컷어웨이(Cutaway) 모드를 코드로 구현했다. 이는 LLM이 공간 기하학을 텍스트 기반의 파라메트릭 코드로 처리할 때 훨씬 더 정밀한 제어가 가능하다는 점을 시사한다.
Gemini 3.5 Flash와 Antigravity 2.0의 벤치마크 성적
2026년 5월 19일 공개된 Gemini 3.5 Flash와 5월 22일 출시된 Antigravity 2.0(에이전트 기반 데스크톱 앱)의 조합은 3D 공간 생성의 새로운 기준을 세웠다. 로마 판테온을 OpenSCAD(텍스트 기반 3D 모델링 도구)로 구현하는 벤치마크에서 이들은 품질 점수 4.5점을 기록하며 테스트 대상 모델 중 최고점을 찍었다. 반면 구현 속도 점수는 1점에 그쳐, 속도를 희생하고 정밀도를 택한 전략을 보여줬다. Antigravity 2.0은 단순히 참조 이미지를 훑는 수준을 넘어 실제 판테온의 건축 파라미터를 직접 검색해 적용했다. 로툰다와 돔, 포르티코의 정확한 치수를 파라메트릭 값으로 변환했으며, 특히 다른 자율 모델들이 모두 놓친 내부 천장의 격자 구조인 코퍼(Coffer) 패턴을 수학적으로 계산해 구현해 냈다. 오쿨루스를 통해 보이는 내부 천장 디테일까지 챙긴 유일한 에이전트다.
VS Code 기반의 IDE였던 Antigravity 1.0과 달리 2.0은 에이전트 중심의 데스크톱 앱으로 완전히 탈바꿈했다. 계획 수립과 작업 실행, 프리뷰 확인이 한 흐름으로 이어지는 구조를 갖췄다. 기존의 에디터 중심 워크플로우를 버리고 에이전트가 주도하는 방식으로 판도를 옮겼다. 이 과정에서 기존 IDE 경험을 선호하던 사용자들의 반발이 있었으나 구글은 에이전트 우선 전략을 밀어붙였다. 3D 공간 코딩에서 중요한 것은 단순한 코드 생성이 아니라 렌더링과 검토, 수정을 반복하는 루프의 효율성이다. Antigravity 2.0은 내부와 외부를 동시에 보여주는 컷어웨이(Cutaway) 모드 제안과 같은 건축적 접근 방식을 도입했다. 이는 AI가 단순한 코더가 아니라 설계자의 관점에서 공간을 해석하기 시작했음을 의미한다.
Gemini 3.5 Flash의 가격은 입력 1M 토큰당 1.50달러, 출력 9.00달러로 책정됐다. 이전 세대인 Gemini 3 Flash의 입력 0.50달러, 출력 3.00달러와 비교하면 정확히 3배 상승한 수치다. 구글은 성능 향상을 명분으로 가격 포석을 다시 짰으며, 이는 과거 Gemini 1.5 Flash 시절의 비용 기준선을 완전히 넘어선 것이다. 기업 입장에서는 품질과 비용, 지연 시간 사이의 새로운 저울질이 필요해졌다. 고정밀 3D 생성이라는 고부가가치 영역에서 가격 인상을 정당화하려는 전략으로 풀이된다. 단순한 모델 업데이트가 아니라 공간 지능이라는 새로운 시장의 가격 책정 기준을 시험하는 단계이며, 고성능 모델의 비용 부담을 감수하더라도 정밀한 공간 구현이 필요한 산업군을 타겟팅한 배치다.
OpenSCAD 기반 파라메트릭 설계와 UI 제어 방식의 격차
텍스트로 기하학적 정의를 처리하는 OpenSCAD(오픈스캐드, 코드 기반 3D 모델링 도구)와 달리 Blender MCP(블렌더 MCP, 모델 컨텍스트 프로토콜) 같은 UI 제어 방식은 구조적 간접성을 띤다. 에이전트가 애플리케이션의 UI 액션을 순차적으로 실행하며 장면 상태를 계속 추적해야 하기 때문이다. 작업이 누적될수록 상태 변이가 발생하며, 이는 곧 추론 오류로 이어진다. 텍스트 기반 설계는 이러한 상태 추적의 비용을 제거해 공간 추론 효율을 극대화하는 포석이 된다.
28개 기둥의 방사형 배치와 5개 링으로 구성된 격자 천장이 단순 모사가 아닌 수학적 정의로 구현됐다. 구글의 Antigravity 2.0(안티그라비티 2.0, 에이전트 중심 데스크톱 앱)은 이 파라메트릭 설계의 이점을 실무 수준으로 끌어올린 결과다. 이는 LLM이 공간을 시각적으로 흉내 내는 단계를 넘어 수치 기반으로 설계하는 단계에 진입했음을 의미한다. 파라메트릭 방식의 핵심은 수정의 용이성이다. 기둥 간격이나 높이가 잘못되었을 때 UI 기반 툴은 숨겨진 장면 상태를 찾아 헤매야 하지만, OpenSCAD는 루프나 파라미터 값 하나만 바꾸면 끝난다. 결과물이 즉시 검사 가능하고 재현 가능하다는 점이 CAD 워크플로우의 비즈니스 임팩트를 만든다.
Codex 5.5 High(코덱스 5.5 하이, 코딩 특화 모델)가 밀도 높은 묘사력에 집중했다면, Claude Sonnet(클로드 소네트, 앤스로픽의 LLM)은 전체적인 실루엣의 깔끔한 구현과 구조적 완성도에 무게를 뒀다. Codex 5.5 High는 가장 밀도 높은 모델을 생성했으나 미리보기 화면과 최종 STL(표준 3D 출력 포맷) 파일 간의 렌더링 불일치라는 치명적인 결함을 드러냈다. 이는 공간 추론 능력과 별개로, 렌더링 파이프라인의 정합성이 최종 제품의 신뢰도를 결정짓는 핵심 변수임을 시사한다. 반면 Claude Sonnet은 마이크로 디테일의 밀도는 낮았지만 구조적 완성도를 높였다. 정밀한 묘사와 안정적인 구조 사이의 트레이드오프가 모델별 특성으로 나타난 셈이다.
에이전트 중심 워크플로우가 바꿀 3D 설계 지형
개발자가 코드를 직접 수정하던 방식에서 에이전트가 설계를 주도하고 인간이 검토하는 구조로 지형이 변했다. 구글의 Antigravity(안티그래비티, 3D 공간 코딩 도구) 2.0은 제품의 정체성을 완전히 재정의했다. 1.0 버전이 VS Code 기반의 IDE(통합 개발 환경)로서 코드 편집에 집중했다면, 2.0은 에이전트 중심의 데스크톱 앱으로 전환했다. 단순한 코드 생성 도구에서 벗어나 계획 수립, 작업 실행, 프리뷰 확인이 유기적으로 연결된 워크플로우를 제공한다. 사용자는 이제 에디터의 세부 기능보다 에이전트가 설계한 전체 경로와 실행 계획을 관리하는 감독자의 역할을 수행한다.
렌더링된 3D 결과물 위에 직접 시각적 노트를 남겨 수정 사항을 지시하는 ModelRift(모델리프트, 3D LLM 플랫폼)의 시각적 어노테이션(Annotation, 주석) 모드가 도입됐다. 텍스트로 복잡한 공간 좌표를 설명하는 대신 시각적 피드백을 통해 수정 루프의 정밀도를 극대화하는 방식이다. 에이전트는 이 피드백을 즉각적으로 해석해 OpenSCAD(오픈스캐드, 코드 기반 3D 모델링 도구) 코드를 정교하게 수정한다. 계획-렌더링-수정으로 이어지는 폐쇄 루프가 완성되면서 텍스트 기반 지시의 모호함이 사라졌다. 설계자는 좌표와 영역 중심의 직관적인 제어를 통해 수정 횟수를 줄이고 작업 속도를 높인다. 이는 3D 설계의 진입 장벽을 낮추는 동시에 전문 설계자의 수정 비용을 획기적으로 줄이는 전략적 포석이다.
3D 프린팅 표준인 STL 포맷을 넘어 3MF 포맷까지 지원하며 제조 공정과의 연결성을 확보했다. AI가 생성한 코드가 단순한 시각적 모형에 그치지 않고 실제 산업 현장에서 즉시 출력 가능한 데이터로 변환되는 구조다. 운영 비용의 상승은 품질 향상이라는 실리로 상쇄되는 흐름이다. Gemini 3.5 Flash의 API 가격은 입력 100만 토큰당 1.50달러, 출력 9.00달러로 이전 세대인 Gemini 3 Flash(입력 0.50달러, 출력 3.00달러) 대비 정확히 3배 증가했다. 하지만 판테온의 천장 격자 구조와 같은 고난도 공간 추론 능력이 비약적으로 향상되며 비용 상승분을 충분히 압도하고 있다. 기업들은 이제 단순한 토큰 비용 효율보다 에이전트가 구현하는 결과물의 정밀도와 제조 가능성에 더 큰 비즈니스 가치를 둔다.




