신약 개발 병목 뚫은 GPT-5.4, 화학 합성 수율 80% 이상 개선

GPT-5.4와 Maria AI의 협업, 찬-람 커플링(Chan-Lam

신약 개발 과정에서는 이론적으로 가능해 보이는 분자 구조를 설계하고도 실제 합성 단계에서 실패해 연구가 중단되는 병목 현상이 빈번하게 발생한다. OpenAI의 GPT-5.4는 Molecule.one의 Maria(고처리량 실험실 통합 에이전트 AI)와 협업하여 이러한 합성 효율을 높이는 성과를 냈다. 두 시스템은 탄소와 질소의 결합을 형성하는 찬-람 커플링(Chan-Lam coupling) 반응의 수율을 개선하는 데 집중했다. 이는 AI가 단순한 추론을 넘어 실제 실험 설계와 수행, 분석 루프를 통해 과학적 발견을 가속화할 수 있다는 가능성을 확인한 사례다.

이번 프로젝트는 OpenAI의 거대언어모델 GPT-5.4가 연구 제안서를 작성하고 실험을 설계하면, Maria가 이를 실제 실험실 지침으로 변환해 수행하는 구조로 진행됐다. 타겟은 일차 설폰아미드(primary sulfonamides)와 보론산(boronic acids)이라는 두 가지 기질의 결합 반응이다. 설폰아미드는 다양한 치료제에 포함되는 중요한 분자 그룹이다. 하지만 보론산과의 찬-람 커플링 반응은 그동안 수율이 낮아 실무적인 활용에 제약이 많았으며, 이는 신약 후보 물질을 실제로 만들어 검증하는 과정에서 큰 걸림돌이 됐다.

전체 공정은 3월 4일 첫 프롬프트를 입력한 시점부터 결과가 공유된 6월 4일까지 총 3개월이 소요됐다. GPT-5.4는 오픈 엔디드(open-ended, 정해진 답이 없는 개방형) 목표를 부여받아 스스로 연구 제안서를 생성하고 데이터를 분석해 후속 실험을 제안했다. 인간 화학자는 방향을 설정하는 스티어링(steering) 프롬프트를 설계하고 최종 제안서를 선택하는 등 루프 내에서 검증 역할을 수행했다. AI가 제안한 가설을 Maria가 실험실의 실제 장비와 연결해 물리적으로 수행함으로써, 이론적 추론이 실제 화학적 결과로 이어지는 경로를 단축했다.

10,080회 실험으로 입증한 TEMPO 첨가제의 효과와 수치 변화

연구 비용을 줄이는 가장 확실한 방법은 실패하는 시간을 단축하는 것이다. Maria Lab은 OAI-M1-03 제안에 따라 총 10,080회의 반응을 수행하며 이 과정을 가속했다. 이는 화학자 한 명이 매일 3회의 실험을 수행한다고 가정했을 때 10년이 걸리는 분량이다. 소수의 샘플만으로는 특정 조합에서만 작동하는 결과가 나올 수 있어 데이터가 왜곡될 위험이 크다. 이를 방지하기 위해 고처리량(한 번에 수천 개의 실험을 동시에 진행하는 방식) 실험을 도입해 다양한 분자 조합에서 일관된 효과가 나타나는지 검증했다.

실험은 두 차례의 사이클로 진행됐다. 첫 번째 단계에서 10종의 산화제 중 TEMPO라는 온화한 산화제(화학 반응을 돕는 물질)가 수율을 높이는 핵심 첨가제임을 찾아냈다. 이후 시스템은 첫 번째 데이터를 분석해 더 정밀한 두 번째 실험을 제안했다. 이 과정에서 TEMPO를 훨씬 저렴한 유사체인 4-hydroxy-TEMPO로 대체해도 성능 손실이 거의 없다는 사실을 확인했다. 실험 규모의 확장이 단순한 속도 향상을 넘어 실제 공정 비용을 낮출 수 있는 대안까지 찾아낸 결과다.

최종적으로 확인된 수치 변화는 구체적이다. 최적화된 조건에서 테스트한 보론산의 88%와 설폰아미드의 83%에서 수율이 향상됐다. 전체 평균 수율은 16.6%에서 25.2%로 상승했다. 특히 연구자가 실무적으로 유효하다고 판단하는 기준인 수율 30% 이상 반응의 비중이 15.6%에서 37.5%로 두 배 이상 증가했다. AI가 설계하고 수행한 대규모 실험 루프가 이론적 추론을 넘어 실제 합성 가능성을 수치로 입증했다.

벤치 스케일 검증 완료, 신약 합성 병목 해소의 실무적 의미

마이크로리터 단위의 스크리닝 실험은 속도가 빠르지만, 실제 약물을 합성하는 벤치 스케일(실험실 규모) 실험은 변수가 많아 재현이 어렵다. 인간 화학자가 이번 연구의 대표 반응들을 벤치 스케일에서 직접 재현한 결과, 14개 기질 쌍 중 11개에서 수율 향상이 확인됐다. 특히 대부분의 사례에서 수율이 2배 이상 증가하는 결과가 나타났다. 이는 AI가 찾아낸 최적 조건이 단순한 수치적 가능성을 넘어 실제 연구실의 실무 워크플로우에서 그대로 작동함을 입증한 결과다.

설폰아미드 그룹은 항암제, 항균제, 이뇨제 등 매우 광범위한 치료 영역의 약물에 포함되는 핵심 화학 구조다. 하지만 일차 설폰아미드와 보론산을 결합하는 찬-람 커플링(탄소-질소 결합 형성 반응)은 그동안 수율이 낮아 실제 합성에 제약이 많았다. 합성 병목으로 인해 이론적으로 유망함에도 불구하고 실제 제조가 불가능해 포기해야 했던 분자 구조들이 많았으나, 이번 수율 개선을 통해 해당 분자들의 탐색 및 생산 가능성이 실질적으로 확대됐다.

전체 과정은 AI가 아이디어를 제안하고 분석하며 인간이 방향을 설정하고 검증하는 준자율(near-autonomous) 방식으로 진행됐다. GPT-5.4가 연구 제안서를 작성하고 실험 데이터를 분석하는 역할을 맡았으며, 인간 화학자는 스티어링 프롬프트(AI의 방향을 조정하는 지시문)를 설계하고 실험 계획의 세부 사항을 수정하며 최종 결과를 독립적으로 검증했다. AI가 방대한 실험 공간을 빠르게 탐색하고 인간이 과학적 판단과 최종 확인을 내리는 협업 루프가 신약 개발의 실질적인 가속 도구가 될 수 있음을 보여준다.

이론적 가능성이 실제 합성으로 이어지지 않던 화학적 병목은 이제 AI의 가설 설계와 물리적 수행의 결합으로 해결된다. 10,080회의 고처리량 실험을 통해 수율 개선을 수치로 증명한 이번 사례는 AI가 단순한 추론 도구를 넘어 실험실의 실질적인 수행 주체로 진입했음을 의미한다.

결국 신약 개발의 속도는 AI가 제안한 가설을 얼마나 빠르게 물리적 루프로 검증하고 분석하느냐에 따라 결정된다. 연구자는 이제 AI가 설계한 실험 루프의 재현성과 수율 수치를 기준으로 실제 합성 가능성을 판단한다.

신약 개발 병목 뚫은 GPT-5.4, 화학 합성 수율 80% 이상 개선

GPT-5.4와 Maria AI의 협업, 찬-람 커플링(Chan-Lam

10,080회 실험으로 입증한 TEMPO 첨가제의 효과와 수치 변화

벤치 스케일 검증 완료, 신약 합성 병목 해소의 실무적 의미

관련 기사