금요일 밤 11시, 여의도의 한 사무실. 모니터에는 수천 장의 재무제표와 엑셀 시트가 띄워져 있고, 개발자는 OCR(광학 문자 인식, 이미지 속 텍스트를 디지털 데이터로 바꾸는 기술) 오류로 꼬여버린 수식들을 하나하나 수정하고 있다. 이런 고단한 풍경이 이제 바뀐다.
Nova Micro 기반의 금융 데이터 추출 팩트
Pulse AI(시각 언어 모델 기반의 문서 이해 도구)와 Amazon Bedrock(관리형 AI 서비스)이 결합한 데이터 추출 파이프라인이 공개됐다. 핵심은 Amazon Nova Micro(amazon.nova-micro-v1:0) 모델로, 128K의 컨텍스트 윈도우(모델이 한 번에 처리할 수 있는 데이터 양)를 제공하며 텍스트 추출 작업에 최적화된 비용 효율성을 갖췄다. 실제 적용 사례에서는 기존에 며칠이 걸리던 복잡한 금융 문서 1,000장의 처리 시간을 3시간 미만으로 줄였다. 이 솔루션은 이미 삼성, Cloudera(데이터 관리 플랫폼), Fortune 500 금융사 및 대형 사모펀드에서 도입해 사용 중이다.
전체 워크플로우는 VPC(Virtual Private Cloud, 가상 프라이빗 네트워크) 내 Pulse 컨테이너나 SaaS(Software as a Service, 클라우드 기반 소프트웨어 서비스) 형태로 문서를 입력받아 처리한 뒤, 추출된 데이터를 S3(Amazon Simple Storage Service, 클라우드 객체 저장소)에 저장하고 Bedrock의 SFT(Supervised Fine-Tuning, 지도 미세 조정) 과정을 거쳐 맞춤형 모델을 배포하는 구조다. 개발자는 AWS CLI(AWS Command Line Interface, 명령줄 도구) v2를 통해 환경을 구축하고, `nova_dataset.jsonl`(한 줄에 하나의 JSON 객체를 저장하는 파일 형식) 형태의 데이터셋을 생성해 모델을 학습시킨다.
이미지 인식을 넘어 의미론적 구조 분석으로
예전의 OCR 방식은 문서를 단순한 이미지로 처리했다. 표의 병합된 셀이나 계층적 데이터 구조를 인식하지 못해 데이터가 밀리거나 엉뚱한 숫자가 입력되는 일이 잦았고, 이는 결국 전체 분석 결과의 시스템적 오류로 이어졌다. 이제는 Pulse AI가 시각 언어 모델과 전통적인 ML(머신러닝) 구성 요소를 통합해 문서의 의미론적 구조를 먼저 파악한다. 단순히 글자를 읽는 것이 아니라 재무제표의 맥락을 이해하고 구조화된 데이터를 뽑아내기 때문에 수동 수정 작업이 획기적으로 줄어든다.
개발자가 바로 체감하는 변화는 Nova Micro 모델을 통해 금융 도메인에 특화된 맞춤형 LLM(Large Language Model, 거대 언어 모델)을 빠르게 구축하고 배포할 수 있다는 점이다. Amazon Bedrock pricing을 통해 비용을 확인하고 EC2(Elastic Compute Cloud, 가상 서버 서비스) 인스턴스와 AWS Secrets Manager(비밀번호 및 API 키 관리 서비스)를 연동하면 보안성이 확보된 파이프라인을 완성할 수 있다. 결과적으로 모델은 문서 구조 인식, 포괄적인 표 추출, 문서 간 데이터 통합이라는 세 가지 핵심 능력을 학습하게 된다.
금융 AI의 승부처는 이제 단순한 텍스트 추출이 아니라 복잡한 표 구조를 얼마나 정확하게 데이터베이스화 하느냐에 달려 있다.




