딥시크 V4, AI 이용료 대폭 인하 — 정부 보안은 미토스급 모델이 맡는다

이번 주 AI 시장의 핵심 키워드는 '극한의 효율'과 '정부 차원의 실전 배치'다. DeepSeek V4는 인프라 확장과 동시에 API 비용을 획기적으로 낮추며 시장을 흔들고 있다. 한편, 안전성 논란이 여전함에도 Mythos급 모델들이 정부 사이버 보안 체계에 본격적으로 통합되는 추세다. 다만 성능 검증 단계에서는 숙제가 남았다. 소프트웨어 공학 능력을 측정하는 DeepSWE 벤치마크 결과, 복잡한 과업에서 모델 간 성능 격차가 뚜렷하게 나타났다. 특히 자동화된 작업 흐름(workflow)에서 발생하는 저품질 반복 코드(slop code) 문제는 업계의 고질적인 골칫거리로 부상했다. 효율은 올랐지만, 품질 관리는 여전한 난제다.

자율형 AI(agent)를 구축하기 위한 도구 생태계도 빠르게 확장 중이다. LangSmith의 Context Hub는 AI가 과거 대화 내용을 기억하는 방식을 자동화했고, LangGraph Dev는 복잡한 자율형 AI의 작업 흐름을 개발자가 한눈에 볼 수 있게 시각화했다. 모델 자체의 성능 경쟁도 치열하다. GPT 5.5는 복잡한 지시사항을 수행하는 능력에서 압도적인 우위를 보였으며, Gro V9 Medium은 Cursor 에디터의 데이터를 학습해 코딩 능력을 정교화했다. 창작 영역의 진화도 눈에 띈다. ElevenLabs Music V2는 음악 장르별 표현력을 높였고, 구글 제미나이 옴니는 비디오의 움직임과 스타일을 변환하는 새로운 기능을 선보였다. 이제 AI는 단순한 생성을 넘어 정교한 제어의 단계로 진입했다.

01반복 지시 없는 자율형 AI — 스스로 학습하고 기억하는 컨텍스트 허브

AI 에이전트를 쓰다 보면 매번 같은 지시를 반복해야 하는 불편함이 있다. 스타일을 수정해 줘도 다음 세션이면 잊어버리기 때문이다. 랭스미스(LangSmith)의 컨텍스트 허브(Context Hub)는 이를 '지속적 개선 루프(durable improvement loop)'로 해결했다. AI가 실수에서 배우고 그 교훈을 영구적으로 기억하게 만든 것이다. 단순히 일회성 답변을 고치는 수준을 넘어, AI가 스스로 내부 규칙서를 다시 쓴다. 이제 AI는 계속 손봐줘야 하는 도구가 아니라, 스스로 진화하는 시스템이다.

핵심은 AI가 자신의 기억 파일에 직접 접근해 내용을 수정하는 방식에 있다. 예를 들어 사용자가 "문체가 너무 화려하니 담백하게 바꿔달라"거나 "전문 서명을 업데이트하라"고 지시하면, AI는 현재 메시지만 수정하는 것이 아니라 컨텍스트 허브가 관리하는 디렉토리 내의 파일을 직접 수정한다. 이 파일들은 영구적으로 보존되기에, 한 번 수정된 스타일 가이드나 서명 규칙은 이후 모든 작업에 자동으로 적용된다. AI가 자신의 행동 변화를 기록하며 스스로 학습하는 구조다.

개발자와 팀 단위 사용자에게는 투명성과 통제권이라는 실질적인 이득이 생긴다. AI의 내부 상태가 블랙박스처럼 가려져 있지 않고 실제 파일 형태로 저장되기 때문에, 팀 전체가 기억 파일을 검토하며 AI의 행동이 어떻게 변하고 있는지 정확히 파악할 수 있다. 실제로 AI는 한 번의 대화 중에도 '파일 수정' 도구를 여러 번 호출해 결과물을 다듬고, "간결하게 작성하라"는 요청을 영구적인 규칙으로 확정 짓는다. 반복적인 프롬프트 입력의 번거로움이 사라졌다. 조직의 고유한 선호도가 AI의 장기 기억에 그대로 녹아들어 결과물의 신뢰도와 전문성이 높아진다.

02딥시크 V4 — 클로드 4개월 예산으로 7년을 쓰는 비용 파괴

딥시크 V4가 고성능 AI 도입의 가장 큰 걸림돌인 비용 장벽을 완전히 허물었다. 경쟁 모델보다 10배에서 최대 100배까지 저렴한 API 가격을 책정했다. 제미나이 3.1 Pro나 Opus 4.6가 상당한 비용을 요구하는 반면, 딥시크 V4는 입력 100만 토큰당 0.435달러, 출력은 0.87달러 수준이다. 이전 버전인 V3.2보다 가격을 약 75%나 낮춘 수치다. 계산해 보면 클로드로 4개월 버틸 예산으로 딥시크는 7년을 쓸 수 있다. AI 도입의 경제학이 통째로 바뀌는 지점이다.

이런 파격적인 가격은 대규모 문맥 창(context window)을 저렴하게 구현하기 위한 설계 변경 덕분이다. 핵심은 '압축 희소 주의 집중(Compressed Sparse Attention)' 기술이다. 단순히 평균을 내는 방식이 아니라, 토큰 4개를 하나의 학습된 항목으로 압축해 메모리 사용량을 줄였다. 덕분에 '라이트닝 인덱서'를 통해 꼭 필요한 데이터만 빠르게 찾아낼 수 있다. 그 결과 대화 기록을 기억하는 메모리 공간인 KV 캐시(KV cache) 사용량이 Llama 2나 3 같은 표준 구조 대비 V4 Pro는 34배, V4 Flash는 49배나 줄었다.

학습 규모와 효율성도 잡았다. 딥시크 V4 Pro는 33조 개의 토큰을 학습했으며, Muon 최적화 도구를 사용해 학습 안정성과 속도를 높였다. 특히 실제 사용 환경에서의 성능을 극대화하기 위해 '양자화 인식 학습(quantization aware training)'을 도입했다. 모델 완성 후 정밀도를 낮추는 일반적인 방식 대신, 처음부터 저정밀도(FP4) 환경을 시뮬레이션하며 학습시킨 것이다. 덕분에 화웨이 칩을 포함한 저사양 하드웨어에서도 즉시 최적의 성능을 낸다.

강화 학습 과정에서 발생하는 충돌을 막기 위해 '온폴리시 증류(on-policy distillation)' 방식을 썼다. 코딩, 수학, 자율 행동(agent) 등 각 분야의 전문 모델이 가진 지식을 하나의 통합 모델로 전이시키는 과정이다. 여기에 코드 변경 사항이 실제로 작동하는지 검증하는 DeepSWE 검증기를 더해 완성도를 높였다. 이 검증기는 기존 SWE-bench Pro 표준보다 훨씬 정확하다. 오탐률(false positive)은 8.5%에서 0.3%로, 미탐률(false negative)은 24%에서 1.1%로 대폭 낮췄다.

03AI가 보안 구멍을 10배 빨리 찾는데, 정작 고칠 사람은 부족하다?

소프트웨어의 보안 취약점을 찾아내는 속도가 인간 엔지니어의 수정 속도를 완전히 앞질렀다. 미토스(Mythos)급 AI 모델이 도입되면서 취약점 발견 속도가 10배나 빨라졌기 때문이다. 이제 문제는 '어디가 고장 났는가'가 아니라 '어떻게 고칠 것인가'로 옮겨갔다. 발견은 즉각적이지만, 보고서를 분류하고 수정 패치를 설계하는 인간의 처리 능력은 이미 한계에 다다랐다. 발견은 빛의 속도지만, 수정은 사람의 속도다. 일부 파트너사는 AI의 발견 속도를 감당하지 못해 오히려 제보 속도를 늦춰달라고 요청하는 상황까지 벌어졌다.

미국 정부는 이 기술의 전략적 가치를 확인하고 CIA와 NSA에 최신 시스템을 구축하기 위해 90억 달러 규모의 비밀 예산을 승인했다. 이번 예산은 엔비디아(Nvidia)의 블랙웰(Blackwell) 칩을 활용한 추론 클러스터(inference clusters, 대규모 AI 모델 실행을 위한 전용 컴퓨팅 환경) 구축에 투입된다. 기존의 정부 기밀 시스템으로는 최신 프런티어 모델이 요구하는 막대한 연산량을 감당할 수 없다는 판단에서 나온 조치다. 국가 안보 인프라의 치명적인 공백을 메우려는 움직임이다.

하지만 이런 기술적 도약과 정부의 막대한 투자에도 불구하고, 앤스로픽은 미토스급 모델의 일반 공개를 보류하고 있다. 모델이 악용되어 심각한 피해를 입히는 것을 막을 만큼 강력한 안전장치가 아직 마련되지 않았다는 이유에서다. 현재 클로드 코드(Claude Code)와 클로드 시큐리티(Claude Security) 적용을 위해 '클로드 미토스 1 프리뷰(Claude Mythos 1 Preview)' 버전이 준비 중인 것으로 알려졌으나, 이 역시 일반 공개가 아닌 신뢰할 수 있는 일부 파트너사 대상의 제한적 배포에 그칠 전망이다. 무분별한 공개로 인한 파멸적 리스크를 피하면서, 통제된 환경 내에서 실용성을 검증하겠다는 전략이다.

04GPT 5.5, 70% 성공률로 클로드 Opus 4.7 압도

기존 AI 코딩 성능 측정 방식은 한계가 명확했다. 학습 데이터에 이미 정답이 포함되어 모델이 답을 외워서 맞히는 '데이터 오염' 문제 때문이다. DeepSWE 벤치마크는 이를 해결하기 위해 공개된 깃허브(GitHub) 데이터를 긁어오는 대신, 사람이 직접 설계한 과제를 사용한다. 진짜 실력을 측정하겠다는 뜻이다. 기존 업계 표준인 SweetBench Pro의 경우, 정답 여부를 가리는 검증 장치(automated grading system)의 오류율이 각각 24%와 8%에 달해 신뢰도가 낮았다는 점이 이를 뒷받침한다.

평가 방식도 완전히 바꿨다. 단계별 지침을 세세하게 주는 대신, 실제 개발자가 소통하듯 '최종 결과물'만 정의하는 행동 기반 프롬프트(behavior-focused prompts)를 적용했다. AI가 스스로 코드 전체를 훑으며 구현 방법을 찾아내야 하는 구조다. 단순한 지시 이행 능력이 아니라, 소프트웨어 엔지니어링의 '직관'을 시험하는 시험대로 옮겨온 셈이다.

결과는 성능과 비용 모두에서 극명한 차이를 보였다. GPT 5.5는 70%의 성공률을 기록하며 20분 만에 과제를 끝냈고, 비용은 5.80달러에 불과했다. 반면 클로드 Opus 4.7은 비용 16달러, 소요 시간 37분으로 효율성 면에서 크게 뒤처졌다. 하지만 접근 방식은 달랐다. GPT 5.5가 지시사항과 눈에 보이는 코드에 충실한 '모범생' 타입이라면, 클로드 Opus 4.7은 코드 저장소 전체를 파악하는 능력이 뛰어났다. 지시사항과 실제 코드가 충돌할 때, 스스로 버전 기록(git logs)을 뒤져 정답을 찾아내는 집요함을 보였다. 효율은 GPT 5.5가 앞서지만, 환경 적응력은 클로드 Opus 4.7이 우위다.

05시키는 대로 짜는 GPT 5.5, 엉뚱한 길로 새는 클로드

AI가 소프트웨어를 짤 때 가장 치명적인 실수는 지시사항을 무시하거나 요구사항을 빼먹는 것이다. 이런 정밀함의 부족은 결국 찾아내기 힘든 버그로 이어진다. 최근 GPT 5.5는 지시 신뢰도(instruction reliability) 면에서 압도적인 성능을 보여주고 있다. 개발자가 설정한 코드 동작 규칙, 즉 저장소 계약(repository contracts)을 놓치지 않고 정확히 수행한다는 뜻이다. GPT 5.5는 프롬프트와 계약 내용을 글자 그대로 해석해 필요한 부분만 수정하는 패치(patch)를 만들어낸다. 딴길로 새지 않고 개발자가 요청한 그대로를 구현한다.

이는 다른 고성능 모델들과 확연히 대비되는 지점이다. 클로드 Opus 4.7의 경우, 지시사항과 실제 코드 저장소의 상태가 일치하지 않을 때 다소 불안정한 모습을 보인다. 클로드는 주변 환경을 잘 살피고 프로젝트의 변경 기록(git history)을 뒤져 해결책을 찾아내는 능력이 뛰어나지만, 정작 중요한 디테일을 놓치곤 한다. 특정 로직은 정확히 구현했지만, 정작 연결된 다른 부분의 코드를 수정하는 것을 잊어버리는 식이다. 반면 GPT 5.5는 주어진 지시를 엄격하게 따름으로써 테스트 대상 중 요구사항 누락률이 가장 낮았다.

정확도뿐만 아니라 효율성에서도 큰 차이가 난다. AI가 정답을 내기 위해 생성하는 텍스트 단위인 출력 토큰(output tokens)으로 이를 측정한다. miniuite 에이전트를 활용해 문제를 풀 때, 클로드 Opus 4.7은 중간값 기준 60,000개의 토큰을 사용했다. 반면 GPT 5.5는 단 16,000개만으로 해결했다. GPT 5.5가 지시를 더 잘 따를 뿐 아니라 훨씬 간결하게 답한다는 증거다. 이는 기업이 AI를 실제 작업 흐름(workflow)에 도입했을 때 작업 시간을 단축하고 운영 비용을 획기적으로 줄일 수 있음을 의미한다.

06AI 코딩: 겉만 번지르르한 '엉성한 코드'가 만드는 리스크

개발자들이 AI에 의존해 코드를 짜면서, 숨겨진 오류가 포함된 소프트웨어를 배포하는 리스크가 커지고 있다. 파이썬(Python)이나 자바스크립트(JavaScript) 같은 인기 언어로 스크립트를 뚝딱 만들어내는 대규모 언어 모델(LLM)의 능력은 언뜻 효율적으로 보이지만, 여기에는 대가가 따른다. 이런 언어들은 유연하고 역동적이라 AI가 빠르게 결과물을 내놓기에 적합하다. 하지만 바로 그 유연함 때문에 AI는 치명적인 실수나 미세한 논리 오류를 쉽게 심는다. 문제는 이런 오류들이 실제 서비스 단계에서 시스템이 멈추기 전까지는 발견하기 매우 어렵다는 점이다. 편리함이 곧 위험이 된 셈이다.

이런 오류를 막기 위해 개발자의 일하는 방식(workflow)이 바뀌고 있다. 단순히 프롬프트를 입력하는 수준을 넘어, 자신의 생각과 AI의 방향을 맞추는 '정신적 정렬(mental alignment)' 단계가 중요해졌다. AI가 제안하는 코드를 맹목적으로 수용하는 것이 아니라, 프롬프트를 짜기 전 논리가 어떻게 작동해야 하는지에 대한 자신만의 설계도(mental model)를 먼저 명확히 하는 것이다. 사람이 의도한 동작의 청사진을 정확히 세워야 AI를 정밀하게 제어할 수 있다. 그래야만 AI의 '추측'이 아닌, 탄탄한 논리적 근거 위에서 코드가 구현된다. 이제는 질문보다 설계가 먼저다.

여기서 '엉성한 코드(slop code)'와 '정석 코드(keynote code)'의 차이가 갈린다. 엉성한 코드는 기술적 정확성보다 '일단 돌아가는 느낌'에 집중하는 이른바 '감 코딩(vibe coding)'의 결과물이다. 검증되지 않은 저품질의 결과물이라는 뜻이다. 개인 프로젝트라면 상관없겠지만, 프로의 세계에서는 치명적이다. 개발자의 커리어와 회사의 안정성이 걸린 비즈니스 환경에서는 반드시 의도가 명확하고 품질이 보장된 '정석 코드'를 지향해야 한다. 현대 개발자의 핵심 역량은 더 이상 문법을 쓰는 기술이 아니다. AI가 만든 지름길이 제품의 완성도를 해치지 않도록 관리하는 '지적 감독 능력'이 진짜 실력이다. 코더의 시대가 가고 감독관의 시대가 왔다.

07Gro V9 Medium, 이론 넘어 실제 사용자 조작 데이터 학습

곧 출시될 Gro V9 Medium은 특정 목적의 데이터를 학습 과정에 포함해 사용자 경험을 한층 정교하게 다듬었다. 일반 공개 전, 기초적인 학습 수준을 넘어 실제 사용자가 필요로 하는 구체적인 작업들을 더 능숙하게 처리하도록 만든 것이다. 개발팀은 모델의 성능을 날카롭게 벼리기 위해 실제 사용자 조작 데이터(Cursor data)를 학습 공정에 추가했다. 기초 학습 이후 이 데이터를 층층이 쌓아 올림으로써, 일반 데이터셋에 존재하는 이론적 패턴이 아니라 실제 현장에서 쓰이는 실용적인 응용 능력에 집중했다. 사용자가 시스템과 어떻게 상호작용하는지, 그 미묘한 차이를 읽어내기 위해서다.

현재 Gro V9 Medium은 유용성과 신뢰도를 극대화하기 위한 엄격한 다단계 공정을 거치고 있다. 기초 학습과 조작 데이터 통합을 마친 모델은 이제 미세 조정(fine-tuning) 단계에 진입했다. 미세 조정은 소규모의 특화된 데이터를 통해 답변을 정교하게 다듬고, 모델의 행동을 설정한 목표에 맞게 정렬하는 과정이다. 이어지는 단계는 강화 학습(reinforcement learning)이다. 보상과 피드백 시스템을 통해 의사결정 능력과 정확도를 최적화하는 고도화된 훈련 방식이다. 며칠 뒤 시작될 이 마지막 최적화 단계가 끝나면, 모델은 '범용적 능력'에서 '특화된 정밀함'으로 진화한다.

새로운 모델을 기다리는 사용자와 개발자들의 기다림도 이제 막바지다. 미세 조정을 지나 강화 학습으로 넘어가는 시점은 개발 사이클의 마지막 구간을 의미한다. 모든 최적화 과정이 완료되면 향후 2~3주 안에 일반 공개될 예정이다. 기초 학습에서 특정 데이터 통합, 그리고 강화 학습으로 이어지는 체계적인 접근은 안정성과 정밀도에 방점을 찍었음을 보여준다. 다양한 학습 방식을 층층이 쌓아 올린 이유는 단순히 지식이 많은 AI가 아니라, 사람들이 실제로 일하는 방식에 기민하게 반응하는 도구를 만들기 위해서다. 결국 추가 데이터 통합은 대중의 까다로운 요구사항을 충족시키기 위한 결정적인 가교 역할을 한다.

08AI 에이전트 설계 — 블랙박스 속 사고 과정을 시각화한 지도

복잡한 AI 에이전트를 만드는 과정은 마치 블랙박스 내부를 다루는 것과 같다. AI가 어떤 단계를 거쳐 결론에 도달하는지 개발자가 정확히 알 수 없기 때문이다. `langraph dev` 명령어는 이 보이지 않는 과정을 시각적인 지도로 바꿔준다. 개발자 개인 컴퓨터에 독립적인 작업 공간(로컬 환경)을 구축하고 스튜디오 페이지를 열면 AI의 사고 체계가 그래프 형태로 나타난다. AI가 과업을 수행하기 위해 어떤 경로로 의사결정을 내리는지 한눈에 파악할 수 있는 흐름도가 그려지는 셈이다. 이제 AI의 사고 과정은 추측이 아니라 확인의 영역이 됐다.

이 스튜디오 페이지는 단순한 그림판이 아니다. 실시간 채팅 인터페이스가 포함되어 있어, 개발자가 AI와 직접 대화하며 동작을 즉시 검증할 수 있다. 특히 AI의 기억(메모리) 관리 능력을 점검할 때 유용하다. 예를 들어 이메일 작성 에이전트를 만들 때, 일시적인 작업 파일은 해당 대화 안에서만 유지하고 핵심 정보는 공용 저장소(context hub repository)를 통해 공유하도록 설계해야 한다. 시각화 도구를 활용하면 AI가 정확한 메모리 파일에 접근하고 있는지, 데이터 구분은 제대로 이루어지는지 명확히 확인할 수 있다. 기억의 혼선을 막는 가장 확실한 방법은 눈으로 직접 보는 것이다.

이러한 기능을 개인 컴퓨터의 작업 흐름(workflow)으로 가져오면서 테스트와 디버깅의 번거로움이 크게 줄었다. 작은 로직 하나를 수정할 때마다 매번 복잡한 시스템을 원격 서버에 배포해 확인할 필요가 없다. 내 컴퓨터에서 즉시 실험하고 수정하는 반복 작업이 가능해졌다. AI 에이전트 제작 방식이 '일단 해보고 고치는' 시행착오 방식에서 '정밀하게 설계하는' 엔지니어링 단계로 진화한 것이다. 내부 로직과 메모리 접근 경로를 투명하게 공개함으로써, AI가 사용자에게 전달되기 전 예측 가능하고 신뢰할 수 있는 동작을 하도록 보장한다. 운에 맡기는 개발의 시대가 끝났다.

09소울 음악은 완벽한데 락 보컬은 왜 이럴까?

일레븐랩스 Music V2가 창작자들을 위한 다재다능한 도구로 진화하고 있다. 이전 버전보다 특정 음악 스타일을 구현하는 능력이 눈에 띄게 좋아졌다. 지난 8월 5일 출시된 Music V1은 준수한 시작이었지만, Suno AI 같은 기존 강자들과 경쟁하기엔 역부족이었다. 하지만 V2는 이 격차를 빠르게 좁혔다. 특히 현대적인 R&B와 소울 장르에서 놀라운 완성도를 보여준다. 기존의 강점이었던 앰비언트 시네마틱 트랙 생성 능력도 그대로 유지했다. 분위기 있는 음악이나 소울풀한 오디오가 필요한 이들에게 이제 확실한 대안이 됐다.

물론 모든 장르에서 완벽한 것은 아니다. 앤섬 락(anthem rock) 장르에서는 여전히 고전하고 있으며, 결과물의 품질 기복이 심하다. 기타 솔로 같은 악기 구성은 훌륭하다는 평가를 받지만, 정작 보컬 퀄리티는 실망스러운 경우가 많다. 보컬에 원치 않는 이상한 효과음이 섞여 나오기도 한다. 악기는 되는데 목소리가 안 되는 셈이다. 락 음악 특유의 공격적이거나 세련된 창법을 AI가 아직 완전히 학습하지 못했다는 증거다.

사용자에게 가장 큰 진입장벽은 작업 흐름(workflow)이다. 고품질 결과물을 얻는 과정이 마치 운에 맡기는 도박처럼 느껴지기 때문이다. 다른 도구들과 달리 Music V2는 예상치 못한 끊김 같은 오디오 오류를 피하기 위해 완전히 다른 명령어 전략(prompting strategy, AI를 안내하는 구체적인 텍스트 지침)을 짜야 한다. 원하는 수준의 결과물을 얻으려면 여러 버전을 생성하고 명령어를 조금씩 수정하는 반복 작업(iterative prompting)이 필수적이다. 현재 AI 생성 방식의 전형적인 과정이긴 하지만, 전문가 수준의 결과물을 얻으려면 창작자의 인내심이 상당히 요구된다.

10제미나이 옴니, 텍스트 대신 이미지로 영상의 스타일과 움직임을 복제

구글 제미나이 옴니가 AI 생성 영상의 시각적 스타일과 물리적 움직임을 훨씬 정밀하게 제어하는 기능을 선보였다. 이제 사용자는 텍스트 프롬프트에만 의존하지 않고, 참조 이미지나 영상을 별도로 입력해 동작 및 스타일 전이(motion and style transfer)를 수행할 수 있다. 복잡한 미학적 요소나 구체적인 움직임을 굳이 말로 설명하며 씨름할 필요가 없어진 것이다. 그냥 예시를 보여주면 AI가 이를 그대로 모방해 전혀 새로운 결과물을 만들어낸다. 설명하는 시대에서 보여주는 시대로의 전환이다.

실제 활용도는 매우 높다. 예를 들어, 한 남자가 걷는 영상에 특정 스타일의 참조 이미지를 입히면 영상 전체의 분위기를 순식간에 바꿀 수 있다. 더 상상력을 발휘하면, 장미가 피어나는 영상과 수정(crystal) 재질의 이미지를 결합해 '수정으로 만들어진 꽃'이 피어나는 장면을 구현하는 식이다. 여러 입력값의 움직임과 스타일을 자유롭게 교차시키면서, 사용자는 자신이 원하는 정교한 시각적 결과물을 일관성 있게 완성할 수 있다.

촬영 기법(cinematography)을 다루는 방식도 달라졌다. 제미나이 옴니는 이제 단일 샷이 아니라, 하나의 프롬프트만으로도 여러 개의 서로 다른 장면을 기본적으로 생성한다. 사용자가 따로 요청하지 않아도 AI가 알아서 카메라 각도를 바꾸거나, 카메라가 피사체를 따라 부드럽게 이동하는 달리 샷(dolly shot)을 넣고, 좌우 시점을 교차시킨다. 전문적인 촬영 지식이 없는 일반인도 AI의 자동 연출 덕분에 수준 높은 영상미를 확보할 수 있게 된 셈이다. 특히 장면 속 특정 사물을 교체하거나, 스토리텔링에 맞는 최적의 카메라 각도를 실험하려는 제작자에게 매우 유용한 도구가 될 것이다.