"돌연변이보다 세포 상태" — MS가 암 치료 정밀도를 높이는 법

2022년 시작된 Project Ex Vivo와 Nature Methods 발표

같은 암 진단을 받고 동일한 약물을 처방받아도 환자마다 치료 결과는 판이하다. 의료진이 통제할 수 없는 이 격차는 정밀 의료가 해결하지 못한 고질적인 한계였다. 마이크로소프트는 브로드 연구소(비영리 연구기관) 및 다나-파버 암 연구소와 협력해 이 문제의 실마리를 찾았다. 세 기관은 2022년부터 'Project Ex Vivo'라는 명칭의 공동 연구를 수행했다. 연구 성과는 2026년 6월 9일 Nature Methods에 게재됐다.

이 프로젝트의 핵심 목표는 세포의 행동 양식을 암 분류 및 치료 체계에 직접 편입시키는 것이다. 암 세포가 주변 환경에 어떻게 반응하고 상호작용하는지를 분석해 치료제 매칭 정확도를 높이려는 시도다. 마이크로소프트는 소프트웨어 역량을 투입해 전통적인 분석 방식으로는 찾아내기 어려운 세포 간의 복잡한 패턴을 식별하는 AI 모델을 구축했다. 연구팀은 질병의 복잡성을 해결하는 것이 환자에게 즉각적인 영향을 줄 수 있는 영역이라는 점에 집중했다.

연구 과정에서 AI 모델의 학습 효율에 대한 구체적인 사실이 드러났다. 단순히 데이터셋의 규모를 키우는 것보다 다양한 세포 행동 패턴을 학습시킬 때 모델이 더 높은 수준의 통찰을 얻었다. 데이터의 양적 팽창이 반드시 성능 향상으로 이어지지 않는다는 점을 확인한 것이다. 이는 대규모 데이터 투입만으로 문제를 해결하려는 기존의 접근 방식과 대조된다.

결국 AI 헬스케어 모델 설계의 핵심 지표는 데이터의 양이 아닌 생물학적 다양성 확보가 된다. 얼마나 많은 데이터를 확보했느냐보다 얼마나 광범위한 세포 상태를 모델에 반영했느냐가 성능을 결정하는 기준이다. 데이터 수집 단계에서부터 질적인 다양성을 확보하는 것이 모델의 실질적인 예측력을 높이는 판단 기준이 된다.

기술이 실제로 작동하는 방식

의사는 환자의 암세포에서 발견된 돌연변이 목록을 보고 약물을 선택한다. 이것이 지금까지의 표준이었다. 암이 시작된 부위나 세포 내 특정 유전자 변이를 기준으로 치료제를 매칭하는 방식이다. 하지만 같은 변이를 가진 환자라도 약물 반응은 제각각으로 나타난다. 분석의 초점을 유전자 변이라는 정적인 데이터에서 세포 상태(Cell State)라는 동적인 행동으로 옮겨야 하는 이유다. 세포 상태는 세포가 주변 환경에 어떻게 반응하고 어떤 행동 패턴을 보이는지를 결정하는 지표다. 유전자가 설계도라면 세포 상태는 그 설계도가 현장에서 어떻게 구현되어 작동하는지를 보여주는 실제 실행 값이다. 정적인 변이 정보만으로는 세포의 실시간 대응 방식을 모두 설명할 수 없다.

췌장암 사례에서 치료 반응이 완전히 갈리는 두 가지 광범위한 세포 상태가 관찰됐다. 기존의 실험실 모델인 오가노이드(미니 장기)는 이 지점에서 명확한 한계를 드러낸다. 인공적으로 배양된 세포는 실제 환자의 체내에서 일어나는 복잡한 세포 상태의 다양성을 모두 반영하지 못한다. 실험실 접시에서는 유효했던 약물이 실제 환자에게 투여했을 때 효능이 급격히 떨어지는 현상이 빈번하게 발생한다. 이는 모델이 특정 세포 상태 하나만을 반영하고 나머지 상태를 누락했기 때문이다. 실제 환자의 생물학적 다양성을 복제하지 못한 모델은 임상 결과와의 괴리를 좁히지 못한다. 결국 세포 상태의 누락이 약물 매칭의 실패로 이어진다.

AI 모델은 이러한 물리적 실험의 한계를 가상 실험으로 해결한다. AI는 세포의 행동 패턴을 학습해 약물 투여 시 세포 상태가 어떻게 전이되는지 시뮬레이션한다. 특정 약물이 암세포의 현재 상태를 어떤 다른 상태로 변화시키는지 예측하는 과정이다. 연구자는 실제 실험실에서 막대한 비용과 시간을 투입하기 전 AI를 통해 유망한 가설을 먼저 선별하는 필터로 활용한다. 이는 단순히 돌연변이를 제거하는 기존의 타겟팅 방식에서 벗어나는 시도다. 세포 상태 자체를 치료가 더 쉬운 형태로 전환시키는 새로운 신약 개발 경로를 설계할 수 있다. 가상 모델이 실제 세포의 반응 경로를 예측함으로써 실험의 정밀도를 높이고 시행착오를 줄인다.

데이터 스케일링보다 중요한 '행동 다양성'

데이터 수집에만 수개월을 쏟은 연구원이 정작 모델의 예측 정확도가 제자리걸음인 상황을 마주한다. 단순히 데이터셋 규모를 키우는 방식으로는 한계가 명확했다. AI 모델은 데이터의 총량보다 광범위한 세포 행동 패턴을 학습할 때 더 많은 정보를 습득한다. 데이터 양을 늘리면 모든 문제가 해결된다는 업계의 통념이 바이오 영역에서 깨진 지점이다. 데이터의 양적 팽창보다 질적 다양성이 성능을 결정하는 핵심 변수가 됐다. 모델이 학습하는 정보의 밀도가 데이터의 개수가 아닌 행동의 가짓수에서 결정된다. 데이터셋 내 세포 상태의 다양성이 모델이 도출하는 통찰의 종류를 근본적으로 결정한다.

세포 상태를 정확히 측정하면 기존 치료제와 환자의 매칭 정확도가 올라간다. 동일한 약물에 반응하는 환자군을 더 세밀하게 구분할 수 있기 때문이다. 임상 시험 대상자를 선정할 때 치료 성공 확률이 높은 그룹을 정밀하게 분류하는 것이 가능해진다. 이는 임상 단계의 막대한 비용 낭비를 줄이고 성공률을 높이는 실질적인 지표가 된다. 환자 개개인의 세포 행동 특성에 맞춘 정밀 처방이 가능해지는 구조다. 매칭 정확도의 상승은 곧 치료 실패로 인한 환자의 손실을 직접적으로 줄이는 결과로 이어진다. 실험실 결과와 실제 환자 사이의 간극을 좁히는 장치가 된다.

신약 개발의 경로 자체가 바뀐다. 지금까지의 약물 개발은 암세포의 돌연변이를 찾아내 제거하는 것에 집중했다. 이제는 세포 상태의 전환을 목표로 하는 전략이 가능해진다. 암세포를 치료하기 쉬운 상태로 강제 전환시켜 약물 반응성을 높이는 방식이다. 타겟 설정의 기준이 유전자 변이에서 세포 행동으로 이동하며 약물 설계의 범위가 확장된다. 이는 기존에 치료가 불가능했던 변이 중심의 접근법을 넘어선 새로운 개발 경로다. 특정 돌연변이가 없더라도 세포 상태를 조절해 치료 효과를 끌어내는 전략적 접근이 가능해진다. 제거가 아닌 전환으로 치료의 목표가 수정된다.

K-바이오 AI가 주목해야 할 '스마트 데이터' 전략

신약 개발의 성패는 임상 시험의 성공률에 달려 있으며, 여기서 발생하는 매몰 비용은 기업의 존속을 결정한다. 수조 원의 투자를 통해 거대 데이터셋을 구축해도 실제 환자에게 효과가 없는 이유는 데이터의 양이 부족해서가 아니다. 바이오 AI 영역에서는 데이터 규모를 키우면 성능이 비례해서 올라간다는 스케일링 법칙의 한계가 확인됐다. 언어 모델과 달리 생물학적 데이터는 단순 합산이 아니라 변이의 종류가 결과값을 결정하기 때문이다.

한국의 AI 신약 개발 기업과 실무자들은 데이터 수집 단계부터 접근 방식을 수정해야 한다. 단순히 샘플 수를 늘리는 방식으로는 실제 환자 몸속에서 일어나는 복잡한 생물학적 변이를 모두 포착할 수 없다. 세포 상태와 같은 구체적인 행동 데이터의 다양성을 확보하는 것이 실질적인 기술 경쟁력이 된다. 데이터의 총량보다 어떤 상태의 세포가 얼마나 다양하게 포함되었는지를 먼저 검증하는 체계가 필요하다.

신약 개발 파이프라인의 타겟 설정 기준 역시 변화가 필요하다. 기존의 유전자 변이 중심 타겟팅에서 세포 상태를 기준으로 하는 전략으로 확장해야 한다. 세포가 주변 환경에 어떻게 반응하고 행동하는지를 분석해 타겟을 설정하면 약물 반응 예측의 정확도를 높일 수 있다. 이는 타겟 발굴 단계에서 발생하는 시행착오를 줄이는 직접적인 방법이다.

가상 실험 모델의 도입은 연구 개발의 비용 구조를 바꾼다. AI를 통해 가설 검증 단계를 가상화하면 실제 젖은 실험실(Wet Lab)에서 소모되는 시간과 비용을 획기적으로 줄인다. 수많은 가설 중 유망한 후보만 골라 실제 실험에 투입하는 효율적인 필터링 체계가 구축된다. AI 헬스케어 모델의 성능을 결정하는 핵심 지표는 이제 데이터의 총량이 아니라 확보된 생물학적 다양성의 범위가 된다.

동일한 암 진단과 약물 처방에도 환자마다 치료 결과는 갈린다. 마이크로소프트와 브로드 연구소의 Project Ex Vivo는 Nature Methods를 통해 데이터 규모보다 세포 행동 패턴의 다양성을 학습하는 것이 더 정밀한 통찰을 제공함을 입증했다.

AI 헬스케어의 성능 지표는 이제 데이터의 총량이 아닌 생물학적 다양성의 범위로 바뀐다. 단순한 데이터 스케일링으로는 도달할 수 없는 임계점이 존재한다. 데이터의 질적 다양성을 확보한 모델만이 실제 임상 결과의 편차를 해결하는 유일한 해답이 된다.