데이터 고립 끝낸다, MS가 공개한 AI 에이전트 통합 체계 'Microsoft IQ'

AI 에이전트를 위한 통합 비즈니스 데이터 컨텍스트 레이어인

새로운 AI 에이전트를 구축할 때마다 기업 내부의 업무 규칙과 데이터 위치를 매번 다시 학습시켜야 하는 번거로움을 어떻게 해결할까. 마이크로소프트가 그 답으로 통합 비즈니스 데이터 컨텍스트 레이어인 'Microsoft IQ'를 발표했다. 기존 Fabric IQ(비즈니스 데이터 컨텍스트 레이어)를 더 넓은 범위의 통합 시스템으로 확장한 결과물이다. 조직의 운영 방식, 보유 지식, 실시간 글로벌 웹 신호 등 4가지 컨텍스트 소스를 제공한다. 모든 에이전트가 이 네 가지 소스를 단일 기반으로 활용해 일관된 컨텍스트를 유지하며 작동한다.

구글은 2025년 IO 행사에서 V3를 공개했다. 비디오 생성 모델 중 처음으로 네이티브 오디오 기능을 탑재한 모델이다. 영상 생성과 오디오 출력이 동시에 이루어지는 네이티브 구조를 통해 비디오 생성 모델의 새로운 기준을 제시했다.

8월 말에 출시된 Gemini 2.5 Flash image(Nano Banana)는 정밀한 이미지 편집 제어 기능을 제공한다. 이미지의 기본 품질을 개선하는 것보다 세밀한 편집 컨트롤(fine grain editing controls)을 통해 실질적인 가치를 제공하는 방식이다. 다른 이미지 생성 모델에서는 불가능했던 수준의 세밀한 편집 제어권을 확보했다.

데이터 커브(Data Curve)는 앤스로픽(Anthropic)의 클로드(Claude) 모델이 다중 요구사항이 포함된 프롬프트에서 일부를 누락하는 특정한 실패 패턴을 보인다는 점을 확인했다. 동기(sync)와 비동기(async) 지원이 모두 필요한 작업에서 하나만 수행하고 다른 하나를 잊어버리는 경우가 빈번하게 발생했다. 이는 오픈AI(OpenAI) 모델에서는 거의 나타나지 않은 일관된 오류 패턴이다.

현실적인 엔지니어링 능력을 측정하는 새로운 코딩 벤치마크

벤치마크가 출시되자마자 모델이 이를 학습해 점수를 올리는 속도가 빨라졌다. Data Curve(데이터 커브)가 현실적인 엔지니어링 능력을 측정하는 DeepSuite(딥스위트)를 출시했다. 기존 벤치마크의 암기 및 단순성 문제를 해결하기 위해 모든 과제를 처음부터 구축했다. 프롬프트를 짧고 자연스럽게 유지했다. 대신 해결을 위해 더 많은 양의 코드를 작성하도록 설계했다. 단순 패턴 매칭이 아닌 실제 구현 능력을 검증하려는 시도다.

에이전트의 판단 근거가 되는 컨텍스트 공급 방식도 구체화됐다. Microsoft IQ(마이크로소프트 IQ)는 네 가지 세부 컨텍스트 소스로 구성된다. Work IQ는 이메일과 일정 등 일상 운영을 담당한다. Foundry IQ는 제도적 지식과 규칙을 관리한다. Fabric IQ는 실시간 운영 상태와 비즈니스 규칙을 모델링한다. Web IQ는 외부의 실시간 글로벌 컨텍스트를 추가한다. 데이터 소스를 성격별로 분리해 에이전트에게 제공하는 구조다.

추론과 시각화의 결합 속도 역시 빠르다. Nano Banana Pro(나노 바나나 프로)는 11월에 출시됐다. 프롬프트 추론 능력을 추가하고 텍스트 렌더링 기능을 강화했다. 인포그래픽을 실제로 구현할 수 있는 수준의 강력한 기능을 도입했다. 텍스트 기반의 응답을 넘어 시각적 정보 구현 단계로 진입했다.

데이터 플랫폼 기업들은 에이전트를 위한 공유 컨텍스트 레이어 시장에 진입했다. Snowflake(스노우플레이크)는 시맨틱 기능을 포함한 컨텍스트 역량을 발표했다. Pinecone(파인콘)은 Nexus(넥서스) 플랫폼을 통해 벡터 데이터베이스를 지식 엔진으로 확장한다. Redis(레디스)는 Iris(아이리스) 컨텍스트 및 메모리 플랫폼을 통해 지식 엔진과 메모리 기능을 강화하고 있다. 데이터 저장소를 넘어 에이전트의 기억 장치를 선점하려는 경쟁이다.

기술이 실제로 작동하는 방식

어제의 정점이 오늘은 기본값이 되는 속도다. GPT-5.5가 벤치마크에서 70%를 기록하며 1위에 올랐다. 2위 GPT-5.4는 56%였다. 3위 Opus 4.7는 54%를 기록했다. 중국의 Kimi 2.6는 24%, DeepSeek V4는 8%로 하위권에 머물렀다. 최상위 모델의 성능 우위가 수치로 입증됐다.

딥수이트(DeepSuite, 소프트웨어 엔지니어링 벤치마크)는 기존 SWE-bench(소프트웨어 엔지니어링 벤치마크)의 데이터 오염 문제를 해결했다. SWE-bench는 GitHub 이슈를 스크래핑해 모델이 정답을 암기하거나 과제가 단순한 한계가 있었다. 딥수이트는 솔루션을 GitHub에 업로드하지 않는다. 리포지토리 파싱과 다중 파일 작업, 도구 사용 등 실제 워크플로우를 요구한다. 모델의 암기력이 아닌 실무 해결 능력을 검증한다.

기업의 관심은 RAG(검색 증강 생성) 범위 확장에서 하부 아키텍처와 공유 컨텍스트 구축으로 이동했다. 벤처비트()의 2026년 1분기 RAG 인프라 시장 트래커에 따르면 100인 이상 조직의 하이브리드 검색 의도가 1월 10.3%에서 3월 33.3%로 3배 이상 급증했다. 단순한 기능 도입을 넘어 데이터 연결 구조를 최적화하는 단계에 진입했다.

구글은 2014년에 딥마인드(DeepMind)를 5억 달러에 인수했다. 생성형 AI가 주목받기 전부터 거액을 들여 AI 분야의 주도권을 확보하려 했다.

현장에서 달라지는 비용과 판단

화면은 같지만 데이터가 흐르는 길이 바뀌었다. 마이크로소프트는 오픈소스 SDK(소프트웨어 개발 키트)와 CLI(명령줄 인터페이스)인 Rayfin을 도입했다. 에이전트가 구축한 애플리케이션을 Fabric으로 직접 배포해 거버넌스가 적용된 프로덕션 백엔드로 활용한다. 모든 데이터는 기본적으로 Microsoft OneLake에 저장된다. 저장된 데이터는 다시 Microsoft IQ 컨텍스트 레이어로 피드백되는 구조를 갖췄다. 에이전트가 새로운 앱을 생성할 때마다 데이터가 외부로 흩어지는 사일로 현상을 방지했다.

GPT-5.5는 Opus 4.7 대비 비용, 속도, 토큰 효율성 모든 면에서 우위를 점했다. 토큰 사용량을 약 절반 수준으로 낮췄다. 실행 시간은 절반 미만으로 단축했다. 비용은 약 3분의 1 수준으로 떨어뜨렸다. 토큰 효율성과 처리 속도 향상은 고성능 에이전트의 상용화 문턱을 낮추는 결과로 이어진다.

상위 모델과 하위 모델을 가르는 핵심 차이점은 자기 검증 능력으로 나타났다. GPT-5.4와 Opus 4.7은 자신의 작업 결과물을 검증하기 위한 테스트 코드를 80% 이상의 확률로 직접 작성했다. 반면 성능이 낮은 모델들은 이러한 접근 방식을 거의 사용하지 않았다. 스스로 결과물을 검증하고 수정하는 능력이 모델의 성능 계층을 나누는 결정적 지표가 됐다.

전 OpenAI 공동 창립자 안드레 카파시(Andre

업계의 시선은 보통 구글 I/O 같은 대형 이벤트의 무대로 향한다. 하지만 이번에는 한 인물의 이동이 더 큰 파장을 일으켰다. 전 OpenAI 공동 창립자 안드레 카파시(Andre Karpathy)가 Anthropic에 합류했다. 많은 AI 관찰자들은 이 소식을 구글 I/O 무대에서 발표된 어떤 내용보다 영향력 있는 발표로 받아들였다. 핵심 인재의 이동이 제품 발표보다 더 강한 시장 신호로 작동했다.

사용자들은 이제 방대한 텍스트를 직접 읽는 대신 듣는 방식을 택한다. NotebookLM(구글의 AI 기반 노트 서비스)의 '오디오 오버뷰(audio overview)' 기능이 시장에서 성공을 거뒀다. 사용자가 입력한 리소스를 바탕으로 합성 AI 팟캐스트가 서로 토론하는 기능을 제공한다. 학습과 시험 공부, 뉴스 파악 등에 유용한 도구로 활용되며 실제 사용자의 호응을 얻었다. 구글은 이 제품을 통해 AI 시장의 모멘텀을 다시 회복하는 계기를 마련했다.

개발자가 백엔드를 선택할 때 기준은 이제 단순한 호환성을 넘어선다. Rayfin(MS의 에이전트 백엔드 도구)은 Supabase나 Neon 같은 기존 Postgres 호환 백엔드와 경쟁한다. 이들의 결정적인 차별점은 거버넌스다. Rayfin은 개별적인 데이터 사일로를 생성하는 기존 방식에서 벗어난다. 대신 전체 애플리케이션 플릿을 Fabric(MS의 통합 데이터 플랫폼)의 통합 데이터 및 컴플라이언스 레이어를 통해 라우팅하여 관리한다. 데이터 관리의 제어권을 개별 앱이 아닌 통합 레이어로 일원화해 관리 효율을 높였다.

새로운 에이전트를 구축할 때마다 업무 규칙과 데이터 위치를 반복 학습시켜야 하는 비효율이 있었다. 마이크로소프트는 Microsoft IQ와 Rayfin SDK로 통합 컨텍스트와 거버넌스된 배포 경로를 제공한다. Work, Foundry, Fabric, Web IQ의 네 가지 소스를 단일 단계로 연결해 에이전트에 주입하는 방식이다.

핵심은 에이전트가 생성한 데이터의 귀속처다. 데이터가 외부 사일로가 아닌 기업 내 통합 데이터 레이어인 OneLake에 자동 저장되는지가 AI 에이전트의 실질적인 효용을 결정한다.