희귀 림프종 진단을 받은 Conno Christou의 사례
누군가는 가벼운 감기 증상을 확인하려 챗봇에 질문을 던지고, 누군가는 정확한 진단을 위해 병원 예약부터 잡는다. AI 챗봇을 건강 상담의 보조 도구로 활용하는 일이 일상이 되었지만, 실제 생명을 위협하는 질병 앞에서 범용 AI의 판단은 위험한 도박이 될 수 있다. Conno Christou는 420,000명 중 1명에게 발생하는 매우 희귀하고 공격적인 비호지킨 림프종(non-Hodgkin’s lymphoma) 진단을 받으며 이 위험한 경계선에 섰다.
이 질환은 식단이나 스트레스 같은 생활 습관과 무관하게 무작위로 일어난 유전자 변이로 인해 발생한다. 발견 당시 종양은 이미 3개월 동안 빠르게 성장하고 있었으며, 발견이 3주만 더 늦어졌다면 곧바로 4기에 도달했을 만큼 진행 속도가 매우 공격적이었다.
이처럼 긴박한 진단 과정에서 일반 목적의 챗봇을 활용하는 행위에 대해 의료 전문가들은 강력한 주의를 권고한다. Mass General Brigham(매스 제너럴 브리검)의 데이터 과학 및 AI 임상 리드인 Danielle Bitterman은 일반 목적 챗봇이 빈번하게 오답을 제시하며, 개인 맞춤형 진단에 필요한 철저한 평가와 검증 과정을 거치지 않았기에 챗봇의 답변을 실제 진단 근거로 삼는 것은 위험하다고 경고한다.
의료 데이터 통합과 전문가 교차 검증 과정
병원 진료를 앞두고 흩어진 검사지와 앱 기록을 챙기다 보면, 정작 진료실에서는 무엇을 물어야 할지 몰라 당황하는 일이 잦다. Conno Christou는 이러한 정보의 파편화를 해결하기 위해 자신의 모든 의료 데이터를 Claude에 입력했다. 혈액 검사 결과와 스캔 데이터, 웨어러블 기기 Whoop의 출력값과 매일 작성한 증상 일지를 모두 통합해 분석했다. 그는 AI가 의사를 대신해 진단하는 것이 아니라, 환자가 의사에게 정교한 질문을 던질 수 있도록 돕는 가이드로 활용했다.
치료법을 결정하는 단계에서는 총 12명의 전문가 의견을 수렴하는 정량적 검증 방식을 택했다. 첫 번째 의사는 성공률 약 60%의 가벼운 화학요법을 권유했으나, 두 번째 의사는 성공률 약 85%의 더 강력한 요법을 대안으로 제시했다. 그는 미국과 해외의 혈액학 및 종양학 전문가들에게 직접 연락해 자문을 구했다.
최종적으로 12명의 전문가 중 11명이 지지한 강력한 치료 경로를 선택하며 데이터 기반의 의사결정을 완료했다. AI로 정리한 데이터와 다수 전문가의 교차 검증을 결합해 치료 성공 확률을 실질적으로 높이는 전략을 실행한 것이다.
Claude를 활용한 오진 방지와 세컨드 오피니언
이러한 개인의 데이터 관리 방식은 실제 오진을 막는 구체적인 결과로 이어진다. 지난 3월 여론 조사에 따르면 미국 성인의 약 3분의 1이 건강 정보와 조언을 얻기 위해 챗봇을 사용하며, 기존 의료 시스템의 정보 공백을 AI로 보완하고 있다.
실제로 림프종 회복 중인 한 환자가 최종 PET 스캔 결과가 모호해 방사선 치료 가능성이 제기된 사례가 있다. 그는 세 차례의 PET 스캔 결과와 MRI 데이터를 Claude에 입력했다. Claude는 환자의 40세 미만이라는 연령과 스캔 특성을 종합해, 항암 화학요법 후 흉선 조직이 다시 활성화되어 질병처럼 보이는 '흉선 리바운드' 현상일 확률이 약 90%라고 분석했다. 이후 다른 의사를 통해 실제 질병이 아님이 확인되면서 불필요한 방사선 치료를 피할 수 있었다.
범용 LLM(대규모 언어 모델)을 전문 데이터 분석 도구로 활용해 전문가의 판단을 다시 확인하는 세컨드 오피니언 전략은 실무적 효용을 증명한다. 림프종 치료 후 PET 스캔의 가짜 양성률이 60%에 달하는 환경에서, AI가 90%의 확률로 흉선 리바운드를 포착해 과잉 진료를 막은 사례가 대표적이다. 사용자가 보유한 의료 데이터를 AI로 1차 필터링하여 전문가와 논의하는 방식은 진단 정확도를 높이고 오진 위험을 낮추는 실무적 도구가 된다.
가벼운 증상을 묻던 챗봇 활용 경험은 이제 전문 의료 데이터의 허점을 찾아내는 정밀한 검증 단계로 진입하고 있다.




