KAIST 물리학과 및 수리과학과 복수전공생이 Claude Code용 시험 대비 지식베이스 플러그인 'PAIDEIA'를 오픈소스로 공개했다. 기존 LLM 활용 방식인 단순 PDF 요약에서 벗어나, 과목별 풀이 패턴과 교수자의 출제 스타일을 추적하는 시스템을 구축한 것이 핵심이다.

이 플러그인은 강의자료, 과제, 솔루션 PDF를 기반으로 개인 맞춤형 학습 그래프를 생성한다. 단순 대화형 인터페이스가 아니라 학습자의 실수와 약점을 누적 관리하는 지식베이스 형태를 취한다. 특히 공학 전공 학습에서 필수적인 '풀이 패턴의 반복'과 '출제 가능 구간의 추적'을 자동화하는 데 집중했다.

핵심 변화

기존에는 학습자가 PDF 파일을 생성형 AI에 직접 업로드해 정보를 추출하는 방식이 일반적이었다. KAIST(한국과학기술원) 물리학과 및 수리과학 복수전공생이 PAIDEIA를 개발했다. 이 도구는 로컬 우선 Claude Code(앤스로픽의 터미널 기반 AI 코딩 도구) 플러그인이다. 개발자는 이를 오픈소스로 공개했다. 강의자료와 과제, 솔루션 PDF를 활용해 과목별 맞춤형 시험 대비 지식베이스를 구축한다.

단순한 텍스트 추출을 넘어 시험 대비 전 과정의 자동화 지형을 구축했다. 우선 강의자료와 솔루션 PDF를 마크다운(Markdown, 텍스트 기반 마크업 언어)으로 변환한다. 솔루션 내에서 반복되는 풀이 패턴을 추출한다. 과제 커버리지를 기반으로 시험 가능성이 높은 영역을 표시한다. 학습자의 취약점을 분석하는 약점 지도와 핵심 내용을 요약한 한 페이지 치트시트, 그리고 풀이 패턴 카드를 생성한다. 나아가 기존 문제의 변형인 twin variant를 생성하고 모의고사를 만드는 자동화 기능을 제공한다.

데이터 제어권 확보를 위한 로컬 우선(Local-First) 설계가 전략적 포석이다. 모든 산출물은 특정 애플리케이션 내부에 갇히지 않는다. 결과물은 plain Markdown 형태로 저장되어 외부 도구와 호환된다. 과목별 폴더 내에 마크다운 파일로 남는 방식이다. 이를 통해 Obsidian(옵시디언, 로컬 기반 지식 관리 노트 도구) 같은 외부 노트 도구에서도 그대로 열람하고 편집할 수 있다. AI가 생성한 지식을 사용자의 개인 지식 저장소로 완전히 통합시키는 구조를 지향한다.

기존과의 차이

기존 AI 튜터들이 친절한 답변과 요약이라는 편의성에 집중했다면 PAIDEIA(대학생을 위한 과목별 학습 시스템)는 학습 지형의 정밀한 추적에 집중한다. 단순 요약을 넘어 교수님의 출제 스타일과 반복되는 풀이 패턴을 분석한다. 사용자가 자주 틀리는 지점과 시험 출제 확률이 높은 구간을 지속적으로 추적하는 구조다. 이는 대화형 챗봇의 문법을 벗어나 편집 가능한 학습 그래프의 형태로 구현된다. 대학생에게 필요한 것은 단순한 튜터가 아니라 개인의 강의자료와 실수를 축적하는 시스템이라는 관점이다.

실질적인 데이터 확보는 OCR(광학 문자 인식) 기술을 통한 답안 채점에서 시작된다. 손으로 푼 답안 PDF를 읽어 레퍼런스 솔루션과 비교해 채점하는 기능을 갖췄다. 여기서 발견된 오답 패턴은 단순 기록에 그치지 않고 데이터로 누적된다. 누적된 데이터는 다음 드릴 문제와 치트시트에 즉각 반영되는 피드백 루프를 형성한다. 학습자의 약점을 정밀하게 타격하는 학습 시스템을 지향한 포석이다.

OCR 구현을 위한 인프라는 특정 모델에 종속되지 않도록 설계했다. 기본적으로 Claude와 Codex의 비전 기능을 활용하는 흐름을 따른다. 사용자의 선택에 따라 Qwen3-VL(시각-언어 모델)이나 Tesseract(오픈소스 OCR 엔진)를 연결해 사용할 수 있다. 모델 선택권을 사용자에게 부여해 기술적 유연성을 확보했다.