매일 아침 데이터 분석 팀의 메신저에는 대시보드에 없는 내용을 묻는 비즈니스 사용자의 질문이 쏟아진다. 분석가는 매번 티켓을 발행하고, SQL을 작성해 결과를 검증한 뒤 전달하는 과정을 반복한다. 이 과정에서 발생하는 병목 현상은 데이터 팀의 생산성을 저해하는 가장 큰 요인으로 꼽힌다. 최근 Amazon QuickSight(기업용 비즈니스 인텔리전스 서비스)가 이런 현장의 고충을 해결하기 위해 새로운 자연어 질의 기능인 Dataset Q&A를 공개했다.

데이터셋 직접 질의와 보안 정책 적용

이번 업데이트의 핵심은 사용자가 대시보드에 미리 구성된 내용에 국한되지 않고, 데이터셋 전체를 직접 질의할 수 있게 된 점이다. Amazon QuickSight는 사용자의 질문을 SQL로 변환하여 전체 데이터셋에 대해 실행하며, 별도의 행 샘플링이나 사전 구성된 계산 필드 없이도 수 초 내에 결과를 반환한다. 기존에 제공하던 Dashboard Q&A(대시보드 시각화 데이터에 대한 질의)와 Topic Q&A(비즈니스 용어로 정의된 필드 중심의 질의)에 이어, 이번 Dataset Q&A가 추가되면서 데이터 탐색의 범위가 완성되었다. 특히 기업이 요구하는 행 수준 보안(RLS)과 열 수준 보안(CLS) 정책이 모든 질의에 자동으로 적용되어, 데이터 거버넌스를 유지하면서도 자유로운 탐색이 가능하다.

맥락 이해와 데이터셋 강화 기능

예전에는 단순히 텍스트를 SQL로 바꾸는 데 급급했다면, 이제는 비즈니스 맥락을 이해하는 에이전트 시스템이 도입되었다. Amazon QuickSight는 질의 전 시맨틱 그래프(데이터 자산 간의 관계를 이해하는 구조)를 통해 대시보드, 데이터셋, 토픽을 검색하여 질문에 가장 적합한 소스를 찾아낸다. 또한, Dataset Enrichment(데이터셋 강화 기능)를 통해 사용자가 YAML이나 JSON 형식으로 필드 설명이나 비즈니스 규칙을 업로드하면, 시스템이 이를 자동으로 반영한다. 사용자는 Chat Explainability(질의 과정 설명 기능)를 통해 시스템이 어떤 논리로 SQL을 생성했는지, 어떤 필터를 적용했는지 단계별로 확인할 수 있어 블랙박스 문제를 해소했다.

개발자가 체감하는 실무 환경 변화

개발자가 바로 체감하는 변화는 복잡한 사전 설정 없이도 즉각적인 데이터 탐색이 가능해졌다는 점이다. Amazon QuickSight는 SPICE(빠른 분석을 위한 인메모리 엔진)와 Amazon Redshift(대규모 데이터 웨어하우스), Amazon Athena(서버리스 쿼리 서비스), Amazon Aurora PostgreSQL(관계형 데이터베이스 서비스), Amazon S3(객체 스토리지) 테이블을 모두 지원한다. 사용법은 간단하다. 데이터셋을 연결한 뒤 채팅창에 질문을 입력하면, 시스템이 데이터 구조를 분석해 답변을 내놓는다. 예를 들어, 시카고 자전거 공유 서비스인 Divvy 데이터를 연결한 후 아래와 같이 질문을 던질 수 있다.

sql
-- 월별 자전거 대여 패턴 탐색 예시
SELECT month, count(*) FROM divvy_trips GROUP BY month;

이 시스템은 질문의 모호함을 해결하기 위해 데이터의 샘플 값과 분포를 미리 확인하고, 작성자가 제공한 비즈니스 맥락을 결합하여 정확한 컬럼을 매핑한다. 이제 데이터 분석의 병목은 기술적 구현이 아니라, 질문의 의도를 얼마나 정교하게 시스템에 학습시키느냐의 문제로 이동했다.