역대 지방선거 공약 55만 건을 데이터로 뚫어낸 Show GN

55만. 2006년 이후 치러진 모든 지방선거 후보들이 내놓은 공약의 총수다. 웬만한 도시의 모든 가구 수보다 많은 양의 약속이 텍스트로 쌓여 있었지만, 그동안 제대로 읽히지 않은 채 버려졌다. 대부분의 공약이 구체적인 실행 계획보다 추상적인 문구로 채워져 있어, 투표 전 공약집을 훑어봐도 내 삶이 어떻게 바뀔지 알기 어렵기 때문이다. 특히 어린이집 확충이나 도로 정비 같은 밀착형 과제들은 거대 담론에 밀려 관심 밖으로 밀려났다. 고려대학교 정치외교학과 연구팀은 이 지점에 주목해 AI 기반 공약 분석 서비스 'Show GN'을 내놓았다. AI가 수십만 건의 텍스트를 읽고 분류하여 시민들에게 실질적인 비교 도구를 제공하는 단계에 진입했다.

55만 건의 공약 추출을 가능케 한 AI 파이프라인

Show GN은 선관위 공개 데이터와 오픈 학술 연구 데이터를 활용해 파편화된 정치 문서를 정형 데이터셋으로 전환했다. 과거에는 선거 공보물을 사람이 일일이 읽고 분류해야 했으나, 이제는 자동화된 파이프라인으로 처리한다.

작업은 광학 문자 인식(OCR) 모델로 공보물 이미지 속 텍스트를 디지털 문자로 추출하는 것에서 시작한다. 이후 공약을 개별적으로 추출하고 임베딩 기반의 아젠다 분석을 수행해 물리적 종이 문서를 분석 가능한 데이터 형태로 변환한다.

분류 체계에는 전 세계 정치학 표준인 CMP(Comparative Manifestos Project)와 한국 행정체계에 맞춘 한국형 KMP 분류 체계를 함께 도입했다. 이를 통해 글로벌 표준과 국내 특수성을 모두 반영해 공약을 범주화했다.

GPT와 Gemini의 결합으로 구현한 '제갈공약' 페르소나

연구팀은 GPT와 Gemini Pro 모델을 결합하고 파인튜닝(Fine-tuning)을 적용해, 선관위 데이터가 공개된 직후 분석과 개발을 마쳤다. AI를 통해 데이터 수집부터 서비스 구현까지의 시간을 대폭 단축한 것이다.

단순한 텍스트 추출을 넘어 '제갈공약'이라는 AI 페르소나를 도입했다. 이 페르소나는 후보자 간 공약을 비교하고, 단순 요약을 넘어 후보자의 전략적 특징을 분석해 결과물을 내놓는다.

연구 범위는 공약 확인에서 멈추지 않는다. 공약이 실제 조례 제정과 입법으로 이어지는 연속성을 추적해, 정치적 약속의 이행 여부를 데이터로 검증하는 연구를 진행할 예정이다.

Show GN은 흩어져 있던 텍스트 정보를 검색과 비교가 가능한 분석 지표로 바꿨다. 이제 공약의 실현 가능성은 정치인의 수사가 아닌 데이터의 정합성으로 증명된다. 비정형 텍스트가 정형 데이터로 전환되면서, 시민들이 직접 공약의 실현 가능성을 분석하고 검증하는 환경이 마련됐다.

역대 지방선거 공약 55만 건을 데이터로 뚫어낸 Show GN

55만 건의 공약 추출을 가능케 한 AI 파이프라인

GPT와 Gemini의 결합으로 구현한 '제갈공약' 페르소나

관련 기사