확산 모델의 적분 학습, 플로우 맵으로 샘플링 속도 개선

매일 아침 생성형 AI 모델을 사용하는 개발자들은 수십 번의 반복적인 노이즈 제거 과정을 거쳐야 하는 확산 모델(Diffusion Model, 노이즈에서 데이터를 복원하는 생성 모델)의 샘플링 속도에 한계를 느낀다. 현재의 확산 모델은 매 단계마다 모델이 경로의 접선 방향을 추정하고, 이를 아주 작은 단위로 쪼개어 적분하는 방식을 취한다. 이 과정은 노이즈 분포를 데이터 분포로 변환하는 데 필수적이지만, 연산 자원을 많이 소모한다는 단점이 있다. 최근 연구자들은 이 적분 과정을 신경망이 직접 학습하게 하여 샘플링 단계를 획기적으로 줄이는 방안을 모색하고 있다.

확산 모델의 결정론적 샘플링과 플로우 맵의 등장

확산 모델의 샘플링 알고리즘은 크게 확률적 방식과 결정론적 방식으로 나뉜다. 기존의 DDPM(Denoising Diffusion Probabilistic Models, 노이즈를 점진적으로 제거해 이미지를 생성하는 기본 알고리즘)은 매 단계에서 조건부 분포를 샘플링하는 확률적 방식을 사용한다. 반면, DDIM(Denoising Diffusion Implicit Models, 확률적 요소를 배제하여 샘플링 속도를 높인 모델)이나 ODE(Ordinary Differential Equation, 미분 방정식을 이용한 결정론적 경로 추적) 기반의 방식은 초기 노이즈에서 시작해 단 하나의 경로를 따라 최종 데이터에 도달한다. 플로우 맵(Flow Maps, 경로상의 임의의 두 점 사이를 직접 연결하는 함수)은 이러한 결정론적 경로의 특성을 극대화한다. 플로우 맵은 모델이 단순히 현재 위치의 접선 방향을 예측하는 대신, 경로상의 임의의 지점에서 다른 지점으로 직접 이동하는 함수를 학습한다. 이는 Boffi et al.이 제안한 분류 체계에 따라 체계적으로 정리되고 있으며, 최근 연구 분야에서 높은 주목을 받고 있다.

기존 확산 모델과의 비교 및 기술적 차이

예전에는 확산 모델이 매 순간의 속도나 방향을 계산하는 데 집중했다면, 이제는 플로우 맵을 통해 경로 전체를 한 번에 예측하는 방식으로 전환되고 있다. 기존의 확산 모델이 매 단계마다 델타(변화량)를 더해가는 방식이었다면, 플로우 맵은 시작점과 끝점 사이의 매핑(Mapping, 입력과 출력을 대응시키는 함수)을 직접 학습한다. 플로우 매칭(Flow Matching, 확산 모델의 경로를 학습하기 위한 프레임워크)에서 신경망은 주로 속도 벡터를 예측하도록 매개변수화된다. 이때 예측되는 속도 벡터는 다음과 같은 수식으로 정의된다.

math

\mathbf{v}_t = \mathbb{E}\left[\mathbf{x}_T - \mathbf{x}_0 \mid \mathbf{x}_t \right]

이 방식은 기존의 노이즈 제거 모델이 예측하던 깨끗한 데이터의 기댓값과 선형적인 관계를 가진다. 즉, 플로우 맵은 기존 확산 모델의 수학적 토대 위에서 샘플링 효율을 최적화하는 새로운 도구로 작동한다. 이러한 접근은 단순히 샘플링 속도를 높이는 것을 넘어, 보상 기반 학습(Reward-based learning, 특정 결과물에 점수를 주어 모델을 튜닝하는 기법)이나 샘플링의 제어 가능성을 높이는 데에도 유리하다.

결과적으로 플로우 맵은 확산 모델의 반복적인 연산 부담을 줄이고, 생성 과정의 경로를 직접 제어함으로써 더 빠르고 효율적인 생성 AI 환경을 구축하는 핵심 기술로 자리 잡고 있다.

확산 모델의 적분 학습, 플로우 맵으로 샘플링 속도 개선

확산 모델의 결정론적 샘플링과 플로우 맵의 등장

기존 확산 모델과의 비교 및 기술적 차이

관련 기사