"tyrosine kinase inhibitor". OncoAgent(암 진단 및 치료 결정을 돕는 AI 시스템)는 의료 용어의 미세한 차이를 구분하기 위해 이 단어를 예시로 들었다. 단순한 키워드 검색이 아닌 정밀한 의미 분석이 암 치료의 성패를 가르기 때문이다. 이제 의료 AI의 경쟁력은 단순한 생성 능력이 아니라 전문 지식의 정확한 인출과 보안으로 옮겨가고 있다.
27B 모델과 AMD MI300X 기반의 고속 학습
OncoAgent는 9B 파라미터의 속도 최적화 모델(Tier 1)과 27B 파라미터의 심층 추론 모델(Tier 2)로 구성된 듀얼 티어 구조를 채택했다. 두 모델 모두 QLoRA(메모리 효율을 높여 모델을 미세 조정하는 기법)를 통해 266,854건의 실제 및 합성 암 사례 데이터를 학습했다. 학습에는 AMD Instinct MI300X(고성능 AI 가속기) 하드웨어가 사용되었다. 시퀀스 패킹 기술을 적용해 전체 데이터셋 미세 조정에 소요된 시간은 약 50분이다. 이는 기존 API 기반 생성 방식보다 56배 빠른 처리 속도다.
CRAG 파이프라인과 제로 PHI 보안 체계
기존의 RAG(외부 지식을 검색해 답변을 생성하는 기술)는 제목만 비슷하고 내용은 무관한 문서를 가져와 환각 현상을 일으키는 고질적인 문제가 있었다. OncoAgent는 이를 해결하기 위해 CRAG(검색된 문서의 관련성을 먼저 평가하는 보정 검색 생성) 파이프라인을 도입했다. Qwen 2.5 Instruct(알리바바가 개발한 오픈소스 언어 모델)를 평가 단계에 적용한 결과, 문서 등급 판정 성공률이 0%에서 100%로 상승했다. 또한 Zero-PHI(환자 개인 식별 정보를 완전히 제거하는 정책)를 강제하는 3단계 안전 검증기를 통해 데이터 주권을 확보했다. 모든 시스템은 온프레미스(자체 서버 설치형)로 배포 가능해 클라우드 API 의존성을 없앴다.
LangGraph 기반의 다중 에이전트 협업 구조
의료진이 체감하는 가장 큰 변화는 워크플로우의 투명성이다. OncoAgent는 LangGraph(에이전트의 흐름을 그래프 형태로 설계하는 도구)를 사용해 8개의 노드로 구성된 상태 기반 유향 그래프를 구현했다. 사례의 복잡도 점수가 0.5 이상이면 자동으로 Tier 2 모델로 라우팅되며, 모든 과정은 수정 불가능한 로그로 남는다. 특히 HITL(사람이 최종 결정에 개입하는 구조) 게이트를 통해 고위험 사례나 신뢰도가 낮은 답변은 반드시 전문의의 확인을 거치게 설계했다. 지식 베이스는 NCCN(미국 종합 암 네트워크)과 ESMO(유럽 ESMO 암 학회)의 가이드라인 70여 개를 PyMuPDF(PDF에서 텍스트를 추출하는 라이브러리)로 정밀하게 파싱해 구축했다.
의료 AI의 승부처는 이제 거대 모델의 크기가 아니라, 폐쇄적 환경에서 전문 지식을 얼마나 정밀하게 통제하느냐에 달려 있다.




