발표에서 확인된 핵심 사실

Bayer AG는 Thoughtworks와 협력하여 제약 연구원이 수동으로 비정형 PDF 보고서를 검색해야 하는 데이터 접근 과제를 해결하기 위해 PRINCE 플랫폼을 개발했다. 클라우드 기반의 PRINCE는 수십 년간 축적된 안전성 연구 보고서를 통합 관리하며 전임상 데이터에 대한 접근성을 높이는 것을 목표로 한다.

시스템의 제어력을 유지하기 위해 컨텍스트 엔지니어링(Context Engineering)과 하네스 엔지니어링(Harness Engineering)을 적용했다. 컨텍스트 엔지니어링은 전문 에이전트 간의 정보 전달 경로를 설정해 데이터 흐름을 제어한다. 하네스 엔지니어링은 오케스트레이션, 복구, 관찰 가능성, 인간 검토 기능을 모델 주변에 배치해 시스템 안정성을 높이는 설계 방식이다. 이는 모델의 개별 성능보다 모델을 둘러싼 엔지니어링 구조가 실제 산업 현장의 제어력과 신뢰성을 결정한다는 판단에 따른 설계다.

확인해야 할 핵심 지점

기존 검색 도구는 불리언(Boolean) 로직에 의존한 경직된 필터링 방식으로 작동해, 연구원의 복잡하고 다층적인 질문을 처리하는 데 한계가 있었다. PRINCE는 RAG(Retrieval-Augmented Generation) 기능을 통합해 자연어 기반의 질의 시스템으로 전환했다. 연구자가 보고서 내용을 직접 질의하면 AI가 필요한 정보를 즉각적으로 추출하는 구조다.

실질적인 구동을 위해 Agentic RAG와 Text-to-SQL(자연어를 SQL로 변환하는 기술)을 결합했다. 이를 통해 전문적인 복잡한 질문에 답하고, 규제 문서의 초안을 자동으로 작성하는 지능형 연구 어시스턴트 기능을 구현했다. 특히 데이터베이스의 정형 데이터와 보고서의 비정형 데이터를 동시에 처리해 정보 누락을 최소화하고 분석의 정확도를 높였다.

이러한 체계는 연구원이 문서를 일일이 뒤지는 수동 작업 대신 AI에게 정답을 요구하는 방식으로 업무 흐름을 바꾼다. 전임상 데이터 분석과 규제 문서 작성이라는 구체적인 워크플로우를 자동화해 데이터 처리 효율을 높였다.

데이터 접근성 해결과 신뢰성 확보 전략

바이엘이 보유한 전임상 지식의 상당 부분은 비정형 PDF 연구 보고서 형태로 축적되어 있다. 과거 시스템 마이그레이션 과정에서 정형 메타데이터가 누락된 경우가 많아 기존 데이터베이스만으로는 정확한 정보 추출이 불가능했다. 이에 PRINCE는 누락된 메타데이터 대신, 검증된 기준 정보(gold standard)가 일관되게 포함된 PDF 보고서 자체를 핵심 정보원으로 활용해 데이터 접근 제약을 해결했다.

동시에 제약 분야의 엄격한 규제 대응을 위해 투명성과 설명 가능성을 설계에 반영했다. 특히 인간 참여(human-in-the-loop) 체계를 통합해 AI가 단독으로 결론을 내리지 않도록 제어하며, 결과 도출의 근거를 명확히 제시해 연구자가 AI의 판단을 비판적으로 검토할 수 있게 했다. 이는 투명한 검증 과정과 인간의 개입을 통해 제약 산업이 요구하는 신뢰성 기준을 충족하며 실무 적용 가능성을 보여준 사례다.

수십 년간 쌓인 PDF 보고서를 수동으로 뒤지던 연구원의 일상은 PRINCE 플랫폼의 등장으로 변화했다. Agentic RAG와 Text-to-SQL의 결합, 그리고 컨텍스트와 하네스 엔지니어링 설계는 단순 검색을 넘어 규제 문서 작성이라는 실질적 워크플로우를 구현했다.

프로덕션급 AI 에이전트의 성패는 모델의 개별 성능이 아니라 컨텍스트 분리와 제어 기준을 어떻게 설계하느냐에 달려 있다. 단순 챗봇 수준의 RAG를 넘어 정교한 제어 구조를 구축하는 것이 실질적인 산업 적용의 핵심이다.