우리가 인공지능에게 그림을 그려달라고 하면 보통 한참을 기다려야 했습니다. 인공지능이 수십 번의 계산을 거쳐 그림을 다듬어야 하기 때문입니다. 그런데 최근에 이 기다림을 획기적으로 줄인 새로운 도구가 나타났습니다.
50번의 붓질을 8번으로 줄인 비결
Baidu (중국의 검색 엔진 회사)에서 만든 ERNIE-Image-Turbo라는 모델이 공개되었습니다. 이 모델은 기존에 50번이나 계산해야 했던 과정을 단 8번의 계산 단계 (그림을 완성하기 위해 거치는 과정)로 줄였습니다.
어떻게 이렇게 빨라질 수 있었을까요. 정답은 DiT (노이즈를 제거해 그림을 만드는 기술)라는 구조를 사용하고 DMD와 RL (속도를 높이고 품질을 올리는 학습 방법)이라는 기술로 핵심만 뽑아 작게 만들었기 때문입니다. 덕분에 화질은 그대로 유지하면서 그리는 속도만 엄청나게 빨라졌습니다.
글자까지 정확하게 쓰는 똑똑한 화가
보통 그림 그리는 인공지능은 그림 속에 글자를 넣는 것을 매우 어려워합니다. 글자 모양이 뭉개지거나 엉뚱한 철자를 쓰는 경우가 많았기 때문입니다.
하지만 이 모델은 포스터나 만화처럼 글자가 많이 들어가는 작업에 매우 강합니다. 복잡한 설명서나 여러 칸으로 나뉜 만화 구성도 척척 그려냅니다. 이제는 인공지능이 그린 그림을 다시 사람이 수정하는 번거로움이 크게 줄어들 전망입니다.
내 방 컴퓨터에서도 돌아가는 강력한 성능
이렇게 똑똑한 모델을 쓰려면 엄청나게 비싼 슈퍼컴퓨터가 필요할까요. 다행히 이 모델은 24G VRAM (그래픽 카드가 사용하는 임시 기억 장치) 정도의 사양만 있으면 충분합니다.
이는 일반적인 고성능 GPU (그림 계산을 빠르게 돕는 부품)를 가진 개인 컴퓨터에서도 돌릴 수 있다는 뜻입니다. 이제 전문 기업이 아니더라도 개인 개발자나 예술가들이 자신의 컴퓨터에서 직접 이 도구를 활용해 창작 활동을 할 수 있게 되었습니다.
빠른 속도와 정확한 글자 표현력을 갖춘 이 모델은 그림 생성 도구의 기준을 바꿀 것입니다. 누구나 쉽고 빠르게 고품질의 시각 자료를 만드는 시대가 성큼 다가왔습니다.




