OpenAI GPT-Rosalind 출시, 신약 개발 95% 전문가 수준 성능 달성

새로운 약을 하나 만드는 과정은 인류 역사상 가장 돈이 많이 들고 시간이 오래 걸리는 일 중 하나다. 보통 10년에서 15년이라는 시간이 걸리는데, 그중 대부분은 반짝이는 아이디어를 내는 순간이 아니다. 과학자들이 산더미처럼 쌓인 논문을 읽고, 실험에 쓸 재료를 설계하고, 복잡한 생물학적 데이터를 해석하는 지루하고 고된 작업에 대부분의 시간을 쓴다. 왜 이 과정은 이렇게 오래 걸릴 수밖에 없으며, 인공지능은 이 지루한 시간을 어떻게 줄일 수 있을까.

OpenAI GPT-Rosalind, 생물학 전문 지식 탑재

OpenAI가 생명 과학 연구를 돕기 위한 GPT-Rosalind(생명 과학 전용 인공지능 모델)를 공개했다. 이 모델은 일반적인 대화가 아니라 생화학(생물 몸속 화학 반응을 연구하는 학문)과 유전학(생물 설계도인 유전자를 연구하는 학문) 같은 전문 분야를 깊게 공부했다. BixBench(생물 정보 분석 능력을 측정하는 시험지)라는 테스트에서 0.751이라는 높은 통과율을 기록하며 실무 능력을 증명했다. LABBench2(실험실 업무 능력을 평가하는 시험지)에서도 기존 모델보다 뛰어난 성적을 거두었으며, 특히 유전자를 복제하는 실험 절차를 설계하는 능력이 크게 향상된 것으로 관찰된다. 이는 인공지능이 단순한 텍스트 생성을 넘어 실제 실험실에서 쓰이는 복잡한 절차를 이해하기 시작했음을 의미한다.

일반 모델과 차별화된 전문 추론 능력

일반 인공지능과 전문 인공지능의 차이는 결과물에서 명확하게 나타난다. 일반 모델이 모든 과목을 적당히 잘하는 학생이라면 GPT-Rosalind는 생물학만 깊게 판 전문가의 모습에 가깝다. 실제 연구소인 Dyno Therapeutics(유전자 치료제를 만드는 회사)와 함께 진행한 실험에서 그 차이가 극명하게 드러났다. 한 번도 공개된 적 없는 RNA(유전 정보를 전달하는 물질) 데이터를 주었을 때, 이 모델은 인간 전문가 상위 5%보다 더 정확하게 기능을 예측했다. 이는 인공지능이 인터넷에 있는 정보를 단순히 외워서 답한 것이 아니라, 처음 보는 데이터에서도 생물학적 원리를 찾아내어 추론하고 있음을 시사한다.

연구 도구 연결과 실무 적용 방식

이 기술은 단순한 채팅 창을 넘어 실제 연구 현장의 도구들과 직접 연결되는 구조를 가진다. OpenAI는 Codex(컴퓨터 코드를 짜주는 도구)를 위한 전용 플러그인(기능을 추가해 주는 부품)을 함께 출시했다. 이를 통해 50개가 넘는 과학 도구와 데이터베이스(정보를 모아둔 창고)에 바로 접근할 수 있는 길이 열렸다. 과학자가 일일이 복잡한 코드를 짜지 않아도 인공지능이 데이터를 가져오고 실험 계획을 세우는 자동화된 흐름이 가능해진다. 현재 Amgen(글로벌 제약 회사)이나 Moderna(백신 개발 회사) 같은 기업들이 이 모델을 실제 연구 과정에 적용하고 있으며, API(서로 다른 프로그램이 대화할 수 있게 연결해 주는 통로)를 통해 기업 전용 환경에서 안전하게 사용된다. 특히 위험한 물질을 만드는 데 악용되지 않도록 하는 엄격한 안전장치도 함께 적용되었다.

인공지능은 이제 넓고 얕은 지식의 시대를 지나 특정 분야의 깊은 전문성을 갖추는 방향으로 진화하고 있다. 생명 과학의 복잡한 문제를 푸는 속도가 획기적으로 빨라질 것으로 보인다.

OpenAI GPT-Rosalind 출시, 신약 개발 95% 전문가 수준 성능 달성

OpenAI GPT-Rosalind, 생물학 전문 지식 탑재

일반 모델과 차별화된 전문 추론 능력

연구 도구 연결과 실무 적용 방식

관련 기사