법무팀 직원이 수백 페이지에 달하는 비정형 PDF 계약서 뭉치 속에서 특정 조항 하나를 찾기 위해 컨트롤+F를 반복해서 누르고 있다. 키워드 검색으로는 문맥을 파악할 수 없어 결국 사람이 일일이 읽으며 내용을 대조해야 하는 상황이다.

AIDA의 구성과 기술 스택

PwC는 AWS(아마존 웹 서비스) 환경에서 구동되는 AIDA(AI 기반 주석 솔루션)를 구축했다. 이 솔루션은 Amazon Bedrock(다양한 파운데이션 모델을 사용할 수 있게 해주는 서비스)의 LLM(거대언어모델)을 통해 복잡한 법률 용어를 해석하고 구조화된 데이터를 추출한다. 인프라는 Amazon ECS(컨테이너 기반 애플리케이션 실행 서비스)와 AWS Fargate(서버리스 컨테이너 컴퓨팅 엔진)를 통해 비동기적으로 작동하며, Amazon SQS(메시지 큐 서비스)가 작업 흐름을 조정한다. 데이터 저장은 Amazon S3(객체 스토리지 서비스)와 Amazon RDS(관계형 데이터베이스 서비스)를 사용하며, 모든 데이터는 TLS 1.2 이상의 암호화 통신과 AWS KMS(키 관리 서비스)를 통한 저장 데이터 암호화를 적용했다. 사용자 인증은 Amazon Cognito(사용자 로그인 및 권한 관리 서비스)가 담당하며 Microsoft Entra ID(기업용 ID 관리 솔루션)나 Okta(인증 서비스)와 연동된다.

네트워크 진입점인 엣지 레이어에서는 AWS WAF(웹 애플리케이션 방화벽)가 위협을 필터링하고 Network Load Balancer(트래픽 분산 장치)가 요청을 NGINX(웹 서버 및 리버스 프록시 소프트웨어)로 전달한다. S3 버킷은 SSE-S3(S3 관리형 암호화 키)를 통해 암호화되며, Block Public Access(퍼블릭 액세스 차단) 설정과 액세스 로깅을 통해 보안 분석 및 감사 기능을 유지한다. AIDA는 템플릿 기반 추출, 문서 수준 채팅, 문서 간 글로벌 채팅이라는 세 가지 핵심 기능을 제공한다.

키워드 검색에서 자연어 쿼리로의 전환

예전에는 특정 단어가 포함되었는지를 확인하는 키워드 기반 추출이나 단순한 계약 관리 시스템에 의존했다. 그러나 AIDA는 템플릿 기반 추출과 자연어 쿼리를 결합해 문맥을 이해하는 방식으로 접근한다. 사용자가 개별 계약서나 프로젝트 내 여러 문서에 대해 자연어로 질문을 던지면, 모델이 관련 근거를 링크로 제공하며 답변한다. 반면 기존 방식은 검색된 결과가 실제 어떤 의미인지 사람이 다시 해석해야 하는 단계가 필수적이었다.

주목할 점은 이러한 변화가 실제 산업 현장에서 수치로 증명되었다는 것이다. 미디어 및 엔터테인먼트 분야의 한 대형 스튜디오는 라이선스 계약서의 권리 분석 시간을 90% 단축했다. 방송, 스트리밍, 극장 상영, 파생 상품 권리와 같은 복잡한 정보를 추출해 스핀오프나 후속작, 글로벌 배급에 관한 의사결정 속도를 높였다. 개발자가 체감하는 변화는 비정형 데이터를 구조화된 인사이트로 변환하는 과정에서 발생하는 수동 작업의 제거다.

이제 계약서 분석의 병목은 읽는 속도가 아니라, AI가 추출한 결과물을 법적으로 어떻게 확정 짓느냐는 검수 프로세스의 설계 문제로 옮겨갔다.