전국 4개 병원 의무기록의 디지털 타임라인 통합
전국 4개 병원에 흩어져 있던 수만 장의 종이 의무기록이 하나의 디지털 타임라인으로 합쳐졌다. 이번 사례의 대상자는 후종인대 골화증(OPLL, 척추 인대가 뼈처럼 딱딱하게 굳는 질환)으로 인한 척수병증으로 감압 및 유합술을 받았으나, 수술 후 통증이 심해지는 척추수술 후 통증 증후군(FBSS)을 겪던 환자였다.
데이터 수집 범위는 해운대백병원, 서울대병원, 부산성모병원, 그리고 제주대병원까지 전국적으로 넓었다. 특히 서울대병원 한 곳에서만 종이 사본이 1,000장이 넘을 정도로 기록의 양이 방대했다. 기존의 의료 환경에서는 환자가 전원할 때마다 종이 사본을 직접 떼어 제출하는 방식이었기에, 환자 스스로 자신의 전체 의료 기록을 통합해 분석하는 것은 불가능에 가까웠다.
분석 과정은 '스캔 $\rightarrow$ OCR(광학 문자 인식) $\rightarrow$ 구조화 $\rightarrow$ 시계열 통합'이라는 정교한 파이프라인을 통해 진행됐다. 먼저 종이 서류를 디지털화한 뒤, OCR을 통해 의사의 손글씨 진료 노트와 인쇄된 검사지를 텍스트로 추출했다. 이후 날짜, 병원, 검사 항목, 수치, 약물, 수술 이벤트 등을 표준 스키마(Standard Schema, 데이터의 구조를 정의한 표준 양식)로 정규화했다. 이를 통해 4개 병원의 기록을 하나의 타임라인으로 묶은 5년 치의 longitudinal EMR(종단적 전자 건강 기록)을 구성했다.
이 과정에서 AI는 마약성 진통제의 용량을 늘려도 통증이 잡히지 않고 오히려 심해지는 비전형적인 반응에 주목했다. AI는 분석 결과로 OIH(Opioid-Induced Hyperalgesia, 오피오이드 유발 통각과민) 가능성을 제시했다. 담당 교수는 이를 확인한 후 "평생 한 번밖에 못 본 케이스"라며 자신이 놓쳤던 부분을 인정했다. 결과적으로 마약성 진통제 사용을 줄이고 척수자극기(SCS) 삽입 수술을 확정하며 치료 방향을 빠르게 수정할 수 있었다.
모델의 지능보다 '데이터 기반'의 차이가 만든 결과
이번 사례는 AI의 추론 능력이라는 결과물보다, 그 추론을 가능하게 만든 '데이터 기반'의 구축 방식에 주목하게 한다. 단순히 LLM(거대언어모델)에 몇 줄의 증상을 입력해 답을 얻는 방식으로는 OIH 같은 희귀 사례를 찾아내기 어렵다. 환자의 5년 치 기록 전체를 시계열로 정렬하고, 약물 투여량과 통증 수치의 상관관계를 데이터로 증명했기에 가능했던 발견이다.
현재 의료 AI 시장의 핵심 쟁점 중 하나는 파편화된 데이터의 통합이다. 병원마다 기록 방식이 다르고, 여전히 많은 양의 데이터가 종이 문서나 비정형 텍스트 형태로 남아 있다. 이번 사례는 이러한 비정형 데이터를 기계 판독 가능한 형태로 전환하는 전처리 과정이 실제 임상적 의사결정에 얼마나 결정적인 영향을 미치는지를 보여준다.
특히 이번 채택 과정에서 드러난 핵심은 AI가 의사를 대체하는 것이 아니라, 의사가 놓칠 수 있는 '데이터의 패턴'을 찾아내어 제시하는 보조 도구로서의 역할이다. 방대한 양의 기록을 사람이 일일이 읽고 시계열로 정렬하는 것은 물리적으로 불가능하지만, 구조화된 데이터 파이프라인을 거친 AI는 수만 장의 기록 속에서 특정 약물 반응의 역설이라는 단서를 빠르게 포착해 냈다.
AI 실무자가 주목해야 할 데이터 파편화 해결책
AI 실무자와 개발자가 이번 사례에서 관찰해야 할 지점은 '데이터의 파편화'를 해결하는 기술적 접근이다. 많은 기업이 더 똑똑한 모델을 찾는 데 집중하지만, 실제 현장에서의 성패는 '어떤 데이터를 어떻게 구조화하여 모델에 넣느냐'에 달려 있다. 특히 의료, 법률, 제조와 같이 레거시(Legacy, 오래된 시스템) 데이터가 많은 산업일수록 단순한 프롬프트 엔지니어링보다 OCR과 정규화 과정을 포함한 데이터 파이프라인 구축이 우선되어야 한다.
한국의 AI 도입 환경에서 가장 큰 걸림돌 중 하나는 데이터의 분절이다. 이번 사례처럼 여러 기관에 흩어진 데이터를 환자 동의 하에 수집하고, 이를 표준 스키마로 통합하는 과정은 기술적 난이도보다 프로세스 설계의 정교함이 요구되는 작업이다. 단일 LLM 입력 방식과 longitudinal EMR 기반 분석의 차이는 결과값의 정확도뿐만 아니라, 실제 행동(수술 결정 등)을 이끌어내는 근거의 수준을 바꾼다.
결국 AI 도입의 실효성은 모델의 파라미터 수가 아니라, 분석 대상이 되는 데이터의 시계열적 완결성에 있다. 실무자들은 모델의 성능 개선에 앞서, 분석하고자 하는 도메인의 데이터가 얼마나 파편화되어 있는지, 그리고 이를 기계 판독 가능한 하나의 타임라인으로 합칠 수 있는 파이프라인이 있는지를 먼저 판단해야 한다.




