"한국 사람 100명에게 물어보면 어떻게 답할까?"라고 Gemini에게 물었을 때 돌아오는 뻔한 답변에 질린 개발자들이 많다. 대부분의 LLM은 한국 사회의 복잡한 계층 구조나 지역적 특성을 무시한 채 평균적인 한국인이라는 가상의 존재를 만들어내기 때문이다. 이번 주 개발자 커뮤니티에서는 실제 통계청 데이터를 입혀 이 문제를 정면으로 돌파한 ManyPerson(통계 기반 AI 페르소나 시뮬레이터)이 화두로 올랐다.

통계청 MDIS 기반 4.1만 명의 AI 시민 구축

ManyPerson은 통계청 MDIS(마이크로데이터 통합서비스)의 2025년 가계금융복지조사 원시 CSV 데이터를 파싱해 가구마스터 34,880건과 가구원 69,929건을 조인했다. 이를 통해 약 4.1만 명의 한국인 페르소나를 구성했으며 성별, 연령, 소득 5분위, 주거 형태, 수도권 여부 등 구체적인 속성을 보존했다. Gemini를 이용해 직업명, MBTI, 성격, 취미, 고향, 1인칭 자기소개를 추가 생성했으며 연소득 1억 이상은 임원이나 전문직으로, 무직이나 은퇴자는 그에 맞는 서사를 갖도록 제약 조건을 설정했다. 기술적으로는 Node.js(자바스크립트 실행 환경)와 Express(웹 프레임워크), PostgreSQL(관계형 데이터베이스)의 JSONB(JSON 데이터를 저장하는 형식)를 사용해 확장 속성을 관리하고 Valkey(레디스 호환 인메모리 데이터 저장소)로 큐와 캐시를 처리하며 GKE Autopilot(구글의 관리형 쿠버네티스 서비스)에서 운영된다.

평균의 함정을 벗어난 가중치 기반 시뮬레이션

예전에는 LLM에게 단순히 한국 시민 100명의 의견을 시뮬레이션해달라고 요청해 결과가 특정 직업군이나 성향으로 쏠리는 현상이 잦았다. 이제는 실제 인구 분포 기반의 페르소나들이 각자의 배경과 말투로 답변하고 통계청 가중값을 적용해 결과를 집계하는 방식으로 바뀌었다. Nemotron-Personas-Korea(한국어 합성 페르소나 데이터셋)가 데이터셋 제공에 집중했다면 ManyPerson은 이를 웹 서비스화해 사용자가 자연어로 질문하고 필터링하며 실시간으로 응답을 확인하는 제품 경험에 초점을 맞췄다. 특히 가구 단위 소득을 가구주, 배우자, 자녀 등 관계에 따라 휴리스틱(경험적 추측 방식)으로 배분해 고소득 배우자를 둔 전업주부나 자산가 부모를 둔 대학생 같은 현실적인 맥락을 반영한 점이 다르다.

개발자가 바로 체감하는 변화는 설문 설계의 효율성이다. 신규 서비스 아이디어에 대해 20~30대 수도권 직장인의 반응을 가늠하거나 정책 이슈에 대해 소득분위별 근거가 어떻게 갈리는지 빠르게 탐색할 수 있다. 사용자는 자연어로 질문을 입력하면 Gemini와 검색 Grounding(외부 정보를 참조해 답변의 정확도를 높이는 기술)을 통해 질문을 정리하고 대상 페르소나를 필터링해 응답을 생성한다. 결과는 긍정, 중립, 부정 또는 객관식 분포로 계산되며 통계청 가중치를 적용한 가중 결과와 인구통계 축별 교차분석까지 제공된다.

이제 AI 시뮬레이션은 그럴듯한 상상의 영역에서 데이터 기반의 가상 표본 영역으로 넘어갔다.