"The hardest part of AI in healthcare is getting humans to use it safely, consistently, and at scale," Purinton says. 롭 퓨린턴(Rob Purinton) AdventHealth 최고 AI 책임자는 기술적 구현보다 의료진이 안전하고 일관되게 AI를 실무에 적용하도록 만드는 '채택'의 과정이 훨씬 어렵다고 강조한다. 그는 기술적 성능보다 의료진이 현장에서 AI를 얼마나 신뢰하고 사용하는지가 도입의 성패를 가르는 핵심 요소임을 지적한다.

의료진이 겪는 극심한 행정적 부담과 복잡한 워크플로우를 해결하기 위해 AdventHealth는 OpenAI의 ChatGPT for Healthcare를 전사적으로 도입했다. 특히 사례 검토를 담당하는 의사들이 차트를 읽고 기준을 확인하며 근거를 작성하는 데 소요되는 10분 내외의 반복적인 작업을 효율화하는 데 집중했다. 이들은 AI를 단순한 '자동화 도구'로 정의하지 않고, 의료진에게 '시간을 되돌려주는(Time back)' 수단으로 프레이밍하며 접근했다. 이는 기술 도입의 성패가 기능의 우수성이 아니라, 현장 사용자가 체감하는 실질적인 시간 확보와 그에 따른 심리적 저항 감소에 있다는 통찰을 바탕으로 한다.

9개 주 병원 시스템에 도입된 ChatGPT for Healthcare와 운영 지표

매년 수백만 명의 환자를 진료하는 미국 9개 주 병원 시스템인 AdventHealth는 극심한 행정적 복잡성과 수요 증가라는 과제에 직면해 있다. 이들은 초기 도입 단계에서 ChatGPT Enterprise를 사용했으나, 이후 의료 환경의 특수한 요구사항을 충족하기 위해 ChatGPT for Healthcare로 전환했다. 의료 데이터의 엄격한 개인정보 보호와 거버넌스, 그리고 규제 준수 지원이 필수적이었기 때문이다. 단순한 데모 수준의 도구가 아니라 전사적으로 확장 가능한 엔터프라이즈 인프라를 구축하려는 목적이 강했으며, 이를 통해 데이터 보호 체계가 강화된 환경에서 안전하게 AI를 확산시키는 기반을 마련했다. 특히 추론 능력과 구조화된 출력, 그리고 강력한 거버넌스 제어 기능을 통해 의료 시스템 전반에 책임감 있게 배포할 수 있다는 확신을 얻었다.

기술적 성능보다 사용자의 실제 채택 여부가 AI 도입의 성패를 결정한다는 판단 아래, 운영진은 채택 자체를 하나의 제품으로 정의하고 이를 정량적으로 관리하는 전략을 수립했다. 핵심 지표로 설정한 것은 사용자당 영업일 메시지 수(Messages per user per business day)다. 주말과 공휴일을 제외한 순수 영업일 기준의 메시지 발생량을 측정함으로써 일관된 기준선을 확보하고, 이를 일반적인 핵심성과지표(KPI)와 동일한 수준으로 모니터링하며 추세를 분석했다. AI를 단순한 자동화 도구가 아니라 의료진에게 시간을 되돌려주는 수단으로 정의하고, 그 활용 빈도를 데이터로 추적하며 조직 내 안착 과정을 관리하는 구조를 설계한 것이다. 이는 AI가 일부 얼리어답터의 전유물이 되지 않고 전사적인 루틴으로 자리 잡게 하는 핵심 장치가 되었다.

전자 건강 기록(EHR, Electronic Health Records) 내에 기록된 타임스탬프 데이터를 활용해 성과 측정의 신뢰도를 높이는 방식을 도입했다. 주관적인 자기 보고 방식이 아닌 시스템 레벨의 데이터 추출을 통해 특정 작업의 시작과 종료 시점을 정밀하게 분석한다. 예를 들어 사례 검토를 위해 차트를 읽고, 관련 세부 사항을 식별하며, 구조화된 근거를 작성하는 일련의 과정에서 소요되는 시간을 측정한다. 기존에 10분가량 소요되던 작업이 AI 지원을 통해 얼마나 단축되었는지, 그리고 이러한 변화가 통계적으로 유의미한 수준인지를 검증한다. 이는 AI 도입이 실제 임상 워크플로우의 효율성을 개선했는지 증명하는 객관적 근거가 되며, 확보된 여유 시간을 다시 환자 케어라는 본연의 가치에 재투자할 수 있는 논리적 토대가 된다. 결국 데이터에 기반한 성과 입증이 AI 확산의 심리적 장벽을 낮추는 결과를 가져왔다.

도메인 기반 피어 그룹(Peer Groups)을 통한 프롬프트 확산 구조

직무별로 세분화된 피어 그룹(Peer Groups)을 운영하는 방식이 중앙 집중식의 대규모 교육 프로그램을 대체했다. 재무팀은 재무팀끼리, HR은 HR끼리 모여 각자의 직무에 즉시 적용 가능한 프롬프트와 워크플로우를 공유하는 구조다. 이는 일반적인 AI 사용법을 가르치는 교육보다 실무 적용 속도를 비약적으로 높이는 결과를 가져온다. 직무 특성에 맞는 베스트 프랙티스가 동료를 통해 전파되면서 사용자가 느끼는 심리적 진입장벽이 낮아지고 실질적인 업무 개선 사례가 빠르게 확산되는 양상이 관찰된다. 특히 AI 활용에 확신이 없어 관망하던 인원들이 동료의 구체적인 성공 사례를 통해 빠르게 실무에 진입하는 경로가 형성되었다.

도구의 기술적 기능을 직무 프로세스에 내재화하는 것이 이러한 확산 구조의 핵심이다. 특히 OpenAI의 구조화된 출력(Structured outputs) 기능을 활용해 문서 초안 작성 과정을 표준화한 사례가 대표적이다. 피어 그룹 내에서 검증된 구조화된 출력 방식은 팀 전체의 문서 일관성을 높이고 불필요한 수정 반복을 줄이는 실무적 가치를 제공한다. 이는 AI를 단순한 채팅 도구가 아니라 특정 업무의 출력 형식을 엄격하게 제어하는 시스템의 일부로 정의하는 접근이다. 결과적으로 개별 작업자의 숙련도에 의존하던 문서 품질이 조직 차원의 표준으로 상향 평준화되는 효과가 나타난다.

임상 현장에서는 추론 능력(Reasoning capability)을 활용해 복잡한 환자 차트에서 세부 사항을 추출하는 워크플로우가 피어 그룹을 통해 공유되었다. 의료진이 수많은 데이터 속에서 필요한 임상적 근거를 찾아내고 이를 구조화된 요약본으로 만드는 과정은 고도의 맥락 이해와 논리적 추론을 요구한다. 피어 그룹은 이러한 추론 과정을 최적화하는 프롬프트 전략과 검증 단계를 공유함으로써 개별 의료진이 겪는 시행착오를 줄이고 전체적인 업무 처리 시간을 단축시켰다. 이는 기술적 가능성을 넘어 실제 임상 현장의 복잡성을 AI가 어떻게 처리해야 하는지에 대한 실무적 해답을 동료 간의 협업으로 찾아낸 사례로 평가된다.

AI 도입을 단순한 소프트웨어 설치가 아닌 지식의 전파 과정으로 재정의하는 것이 이 구조의 결론이다. 직무별로 최적화된 프롬프트가 피어 그룹을 통해 유기적으로 흐르면서 조직 전체의 AI 리터러시가 상향 평준화되는 기제가 작동한다. 이는 중앙에서 내려오는 일방향적 지침보다 현장의 실무자가 체감하는 효용성에 기반하여 확산되기에 훨씬 강력한 실행력을 갖는다. 도메인 지식과 AI 제어 기술이 결합된 구체적인 워크플로우가 공유될 때 비로소 AI는 단순한 생산성 도구를 넘어 기업의 핵심 운영 인프라로 자리 잡는 것으로 분석된다.

'자동화'에서 '시간 확보'로: 프레이밍의 전환과 인프라 선택 기준

의사들이 사례 하나를 검토하기 위해 차트를 읽고 관련 세부 사항을 식별하며 구조화된 근거를 작성하는 과정에는 보통 10분 정도가 소요된다. 이는 단순한 단일 작업이 아니라 여러 단계의 시퀀스로 이루어진 복합적인 행정 절차다. AdventHealth(미국 9개 주에서 운영되는 병원 시스템)는 이 과정을 단순한 자동화의 대상으로 보지 않고 시간 확보(Time back)라는 관점으로 재정의했다. 자동화라는 표현이 주는 역할 대체에 대한 거부감을 줄이는 동시에, 10분 걸리던 작업을 2분으로 압축해 확보한 시간을 환자 케어라는 본질적 가치에 재투자한다는 논리를 세운 것이다. 이러한 프레이밍의 전환은 의료진뿐만 아니라 재무, 인사, IT 팀이 겪고 있던 상시 운영 모드(Constant operations mode, 고부가가치 업무보다 반복적 행정 처리에 매몰된 상태)의 압박을 해소하고 실질적인 업무 전환을 이끄는 동인이 되었다.

실험적인 파일럿 단계를 넘어 전사적 배포로 나아가는 과정에서 도구 선택의 기준은 단순한 기능 구현에서 엔터프라이즈 인프라(Enterprise infrastructure)의 안정성으로 옮겨갔다. 단순한 데모 수준의 챗봇은 개별 사용자의 생산성을 일시적으로 높일 수는 있으나, 수천 건의 사례를 일관되게 처리해야 하는 의료 시스템 전체에 적용하기에는 제어권과 신뢰성 측면에서 한계가 관찰된다. OpenAI를 선택한 결정적 이유는 모델의 고도화된 추론 능력과 구조화된 출력(Structured outputs), 그리고 세밀한 거버넌스 컨트롤 기능에 있었다. 이는 AI를 단순히 메일을 빨리 쓰고 요약을 돕는 생산성 소프트웨어로 보는 것이 아니라, 조직의 표준 프로세스에 통합하여 책임감 있게 확장할 수 있는 기반 시설로 인식했음을 의미한다.

데이터 보호와 규제 준수(Compliance, 법적 요구사항 및 표준 준수)는 의료 데이터의 특성상 타협할 수 없는 필수 요건이다. 이를 위해 ChatGPT Enterprise를 도입한 후, 규제 환경에 최적화된 추가 안전장치가 포함된 ChatGPT for Healthcare로 확장하며 거버넌스 체계를 강화했다. 특히 OpenAI와의 긴밀한 협업 체계는 파일럿 설계부터 실제 배포까지의 주기를 단축하는 가속기 역할을 했다. 기술적 가능성의 최전선에 있는 모델을 활용하면서도, 엔터프라이즈 수준의 제어권을 확보함으로써 대규모 조직 내에서 안전하고 일관된 AI 사용 환경을 구축할 수 있었다. 결과적으로 인프라의 선택 기준은 단순한 모델의 성능 수치가 아니라, 규제 준수와 거버넌스라는 엔터프라이즈 요구사항을 얼마나 빠르게 수용하고 구현할 수 있는가에 맞춰졌다.

10분 작업을 2분으로 단축하며 되찾은 '파자마 타임'

의료 현장에서 의사 결정의 핵심은 차트 검토와 임상 근거 마련에 있다. 어드벤트헬스(AdventHealth, 미국 9개 주에서 운영되는 대규모 병원 시스템)의 사례를 보면, 기존에 의사 자문단이 환자 사례 하나를 검토하는 데 소요하던 시간은 약 10분이었다. 이는 단순히 차트를 읽는 행위를 넘어, 관련 세부 사항을 식별하고 임상 기준을 대조하며 구조화된 근거를 작성하는 일련의 복잡한 과정을 포함한다. 그러나 ChatGPT for Healthcare(의료 환경을 위해 데이터 보호 및 규정 준수 기능을 강화한 OpenAI의 기업용 AI 플랫폼)를 도입한 이후, 동일한 작업에 소요되는 시간은 2분으로 단축되었다. 이는 단순한 속도 개선을 넘어, 수천 건의 사례를 처리해야 하는 병원 시스템 전체의 운영 효율을 근본적으로 재편하는 수치다.

이러한 작업 시간의 획기적 단축은 실무자들에게 '파자마 타임(Pajama time)'이라 불리는 퇴근 후 자택에서의 잔여 문서 작업 부담을 제거하는 결과로 이어졌다. 과거에는 퇴근 이후에도 이어지던 행정 업무가 정규 근무 시간 내로 흡수되면서, 의료진은 온전히 환자 케어와 가족과의 시간에 집중할 수 있는 환경을 확보하게 되었다. 이는 단순히 개인의 삶의 질 향상에 그치지 않는다. 처리량 지표(Throughput metrics) 측면에서 볼 때, 작업당 소요 시간과 턴어라운드 시간의 개선은 곧 병원의 임상 수용력 확대와 직결된다. 재무, 인사(HR), IT 부서 또한 문서 작성 및 요약 사이클 타임이 대폭 감소하며, 반복적인 행정 업무에서 벗어나 보다 고부가가치의 전략적 업무로 인적 자원을 재배치하는 동력을 얻었다.

어드벤트헬스는 이러한 변화를 단순히 체감에 의존하지 않고, 전자 건강 기록(EHR) 시스템 내 타임스탬프 데이터를 활용해 통계적으로 유의미한 수치를 추적한다. 매일 사용자당 메시지 전송량과 같은 KPI를 관리하며, 도메인별 피어 그룹을 통해 프롬프트와 워크플로우를 최적화하는 방식으로 도입 효과를 극대화했다. 개발자나 시스템 설계자 관점에서 볼 때, 이 모델의 핵심은 AI를 자동화 도구로만 정의하지 않고 '시간을 되돌려주는 자산'으로 프레이밍한 전략에 있다. 결과적으로 10분짜리 업무를 2분으로 압축함으로써 확보된 주당 수천 분의 여유 시간은, 병원 시스템이 환자 중심의 전인적 케어를 실현하기 위한 실질적인 운영 자본으로 재투자되고 있다.

한국 의료 AI 실무자가 주목해야 할 '채택 중심'의 배포 전략

의료 현장에서 AI 도입의 성패는 모델의 정확도보다 사용자가 실제로 도구를 켜는 횟수에서 갈린다. 많은 실무자가 고성능 모델을 배포하면 자연스럽게 사용률이 올라갈 것이라 기대하지만, 실제 의료 환경은 매우 보수적이며 기존 워크플로우에 대한 의존도가 극도로 높다. 따라서 AI 도입을 단순한 제품 사용(Product usage)이 아니라 리더십의 변화(Change leadership)로 정의하는 관점의 전환이 필요하다. 이는 기술적 완성도를 높이는 작업보다, 의료진이 AI를 통해 얻을 수 있는 실질적인 시간적 이득을 정의하고 이를 조직 문화에 이식하는 과정에 가깝다. 특히 한국 의료 환경처럼 업무 강도가 높고 위계가 뚜렷한 조직일수록, AI를 자동화 도구가 아닌 의료진에게 시간을 되돌려주는 수단으로 프레이밍하는 전략이 유효하게 관찰된다.

정량적인 가치 입증은 의료진의 신뢰를 구축하고 소규모 파일럿 단계를 넘어 전사적 확산으로 나아가기 위한 필수 조건이다. 단순히 설문조사를 통한 주관적 만족도 조사가 아니라, 비즈니스 데이 기준 사용자당 메시지 수나 작업당 소요 시간과 같은 운영적 측정 지표를 KPI(핵심성과지표)로 설정하여 관리하는 전략이 요구된다. 예를 들어 10분 걸리던 사례 검토 작업을 2분으로 줄인 결과가 시스템 로그나 전자의무기록(Electronic Health Record, EHR)의 타임스탬프를 통해 통계적으로 유의미하게 증명될 때, 비로소 의료진은 도구의 효용성을 체감한다. 소위 파자마 타임(Pajama time)이라 불리는 퇴근 후 문서 작업 시간을 실질적으로 줄여주는 결과는 어떤 기술적 지표보다 강력한 채택 동기가 된다. 이러한 데이터 기반의 신뢰 구축은 AI가 단순한 생산성 소프트웨어가 아니라 임상 역량을 확장하는 필수 인프라라는 인식을 심어준다.

신뢰가 확보된 이후의 확장 모델은 거버넌스와 측정 체계를 엄격히 유지하며 더 깊은 임상 영역으로 진입하는 경로를 따른다. 초기 단계에서 행정 부담 경감과 같은 저위험 영역에서 성공 사례를 만들었다면, 향후에는 환자 접근성(Patient access) 개선이나 임상 의사결정 지원(Clinical decision support, CDS)과 같은 고부가가치 영역으로의 확장이 제안된다. 이때 중요한 것은 중앙 집중식의 일방향 교육보다 재무, 인사, 임상 등 도메인별 피어 그룹(Peer group)을 통해 실제 사용 가능한 프롬프트와 워크플로우를 공유하는 상향식 확산 방식이다. 거버넌스 통제권을 통해 안전성과 일관성을 유지하면서도 현장의 자발적 채택을 유도하는 이 모델은 한국의 복잡한 의료 체계 내에서도 실무적인 배포 전략으로 작동할 가능성이 높다. 기술적 성능의 우위보다 중요한 것은 운영적 측정과 신뢰 기반의 리더십을 통해 현장의 거부감을 낮추고 실질적인 사용 경험을 설계하는 일이다.