2 GB. 이 수치는 Remove-AI-Watermarks 도구를 처음 실행할 때 다운로드해야 하는 모델 가중치의 크기다. 비유하자면, 정교한 지우개질을 하기 위해 미리 준비해야 하는 전문 도구 세트의 무게라고 할 수 있다. 그런데 이 무거운 도구 세트가 겨냥하는 대상은 구글의 SynthID나 C2PA 같은 최신 AI 워터마크들이다. 단순히 이미지 위에 얹어진 로고를 가리는 수준을 넘어, 이미지 데이터 속에 깊숙이 박힌 'AI 생성 증명서'를 통째로 도려내려는 시도다.
Remove-AI-Watermarks, Gemini와 SynthID v2까지 대응하는 통합 제거 도구 공개
구글 제미나이(Gemini)나 챗GPT의 달리(DALL-E)로 이미지를 만들면 눈에 보이는 로고나 보이지 않는 식별 표식이 함께 저장된다. 최근 공개된 Remove-AI-Watermarks는 이런 다양한 AI 모델의 워터마크를 명령어 한 줄로 지워주는 CLI(명령줄 인터페이스, 텍스트 기반 제어 도구) 도구다. 이 도구는 구글 제미나이의 나노 바나나(Nano Banana)부터 스테이블 디퓨전(Stable Diffusion), 어도비 파이어플라이(Adobe Firefly), 미드저니(Midjourney)까지 폭넓게 지원한다. 사용자는 웹 서비스인 raiw.cc를 통해 설치 없이 바로 이용하거나, 파이썬 환경에서 다음 명령어로 직접 설치해 사용할 수 있다.
pip install remove-ai-watermarks
bash
pip install -U remove-ai-watermarks먼저 눈에 보이는 워터마크 제거 방식이 흥미롭다. 구글 제미나이는 이미지 위에 반짝이는 스파클 로고를 겹쳐서 넣는데, 이는 비유하자면 투명한 스티커를 사진 위에 붙인 것과 비슷하다. 도구는 미리 분석한 알파 맵(투명도 지도)을 이용해 이 스티커를 떼어내고, 남은 흔적은 주변 픽셀로 자연스럽게 채우는 인페인팅(Inpainting, 빈 공간 채우기) 기술로 마무리한다. 특히 NCC(정규화 상호 상관) 검출기를 사용해 이미지 크기가 바뀌거나 일부가 잘려나가도 로고의 위치와 크기를 정확히 찾아낸다. 처리 속도는 이미지 한 장당 약 0.05초로 매우 빠르며 별도의 GPU(그래픽 처리 장치)가 필요 없다.
더 까다로운 것은 눈에 보이지 않는 표식이다. 구글의 신스아이디(SynthID)나 C2PA 콘텐츠 자격 증명 같은 기술은 이미지의 픽셀 값이나 주파수 영역에 암호 같은 패턴을 심어둔다. 쉽게 말하면 종이 지폐의 숨은 그림처럼 육안으로는 안 보이지만 전용 스캐너로는 읽히는 방식이다. 이 도구는 SDXL(스테이블 디퓨전 XL) 모델을 기반으로 이미지를 미세하게 재생성해 이런 보이지 않는 패턴을 무력화한다. 특히 2025년 10월 도입된 신스아이디 v2까지 대응하도록 설계되었다. 보이지 않는 워터마크 제거를 위해서는 GPU 기반의 설치가 필수적이다.
pip install remove-ai-watermarks[gpu]마지막으로 파일 내부에 숨겨진 메타데이터(Metadata, 데이터에 관한 데이터) 정리 기능이 포함되어 있다. EXIF나 XMP 같은 표준 규격 속에 들어있는 메타데이터에는 보통 제작 도구 정보가 기록되어 있어, 소셜 플랫폼이 이를 읽어 자동으로 AI로 생성됨이라는 라벨을 붙인다. 도구는 이 파일의 각 층을 분석해 AI 관련 필드만 골라 삭제하고 저작권이나 제목 같은 기본 정보는 그대로 유지한다. 이는 제품 포장지에 붙은 제조사 라벨만 떼어내고 내용물은 보존하는 것과 같다.
NCC 탐지와 SDXL 확산 모델을 이용한 3단계 세척 프로세스
이번 업데이트에서 가장 먼저 작동하는 것은 눈에 보이는 로고를 지우는 과정이다. 가시적 워터마크를 제거하기 위해 3단계 NCC(Normalized Cross-Correlation, 정규화 상호 상관) 탐지기를 사용한다. 쉽게 말하면 NCC는 이미지 속에서 특정 패턴의 위치와 크기를 정밀하게 찾아내는 추적 장치와 같다. 특히 이미지가 리사이징되거나 일부가 잘려 나간 상태라도 유연하게 대응해 로고의 정확한 좌표를 짚어낸다. 탐지기가 위치를 찾으면 알파 맵(투명도 정보가 담긴 지도)을 이용해 해당 영역을 역전시키고, 그라디언트 마스크 인페인팅(경계선을 자연스럽게 채우는 기술)으로 마무리해 흔적을 없앤다. 이 과정은 연산량이 매우 적어 별도의 GPU 없이도 이미지 한 장당 약 0.05초라는 빠른 속도로 처리된다.
하지만 픽셀이나 주파수 영역에 숨겨진 비가시적 워터마크는 단순히 지우는 것만으로는 해결되지 않는다. 그래서 이 도구는 SDXL(Stable Diffusion XL, 고해상도 이미지 생성 모델) 기반의 재생성 파이프라인을 가동한다. 비유하자면 옷에 밴 지워지지 않는 얼룩을 제거하기 위해, 옷의 디자인은 그대로 유지한 채 원단 자체를 새로 짜내는 방식이다. AI가 이미지를 다시 그려내어 기존의 숨은 패턴을 완전히 무력화하는 원리다. 이전의 SD-1.5 모델은 768 픽셀 수준에서 한계가 있었으나, SDXL은 고해상도 대응 능력이 뛰어나 구글의 최신 워터마크 기술까지 효과적으로 무력화한다. 이러한 성능 향상을 바탕으로 2026년 5월부터는 SDXL 방식이 기본 설정값으로 적용되었다.
이미지를 통째로 다시 그릴 때 발생하는 얼굴 왜곡 문제는 YOLO(You Only Look Once, 실시간 객체 탐지 모델)로 해결한다. 확산 공정에 들어가기 전 YOLO가 이미지 속 인물을 실시간으로 감지해 얼굴 부분을 따로 추출해 둔다. 배경과 나머지 부분이 재생성된 후에 미리 보관해 둔 원본 얼굴을 타원형 마스크로 부드럽게 합성해 원래의 생김새를 그대로 보존하는 식이다. 여기에 아날로그 휴머나이저 기능을 더해 최종 결과물을 다듬는다. 필름 그레인(입자감)과 색수차(Chromatic Aberration, 렌즈 색 분산 현상)를 인위적으로 주입하는 단계다. 색수차는 렌즈의 특성으로 인해 빛이 분산되며 색 테두리가 생기는 현상인데, 이를 통해 디지털 파일이 아니라 실제 화면을 카메라로 촬영한 사진처럼 위장함으로써 AI 생성 이미지 판별기의 추적을 피한다.
136비트 페이로드의 한계와 AI 콘텐츠 식별 체계의 충돌
구글이 2025년 10월 제미나이 3 프로(Gemini 3 Pro) 등에 도입한 신스ID-이미지 v2(SynthID-Image v2)는 이미지 속에 136비트의 페이로드(Payload, 데이터 전송 시 실제 포함된 핵심 정보)를 심는다. 쉽게 말하면 이미지라는 도화지 속에 아주 미세한 디지털 일련번호를 숨겨두는 방식이다. 비유하자면 위조 방지 지폐에 숨겨진 홀로그램과 비슷하다. 육안으로는 전혀 보이지 않지만 전용 탐지기로 읽으면 이 이미지가 어떤 계정에서 생성되었는지, 어떤 세션에서 만들어졌는지 식별할 수 있는 고유 식별자 역할을 한다. arxiv 2510.09263 논문에서 다루는 이 기술은 단순한 표식을 넘어 생성자와 콘텐츠를 연결하는 강력한 끈이 된다.
하지만 여기서 기술적 충돌이 발생한다. 워터마크 제거 도구를 사용해 이미지 파일 내의 페이로드를 지우면 소셜 플랫폼의 자동 탐지 시스템은 더 이상 이 사진을 AI 생성물로 인식하지 못한다. 결과적으로 플랫폼이 자동으로 붙이는 메이드 위드 AI(Made with AI, AI로 생성됨) 라벨이나 제3자 분류기를 우회하는 것이 가능해진다. 이는 AI 콘텐츠의 투명성을 확보하려는 플랫폼의 정책과 이를 회피하려는 사용자의 요구가 정면으로 충돌하는 지점이다. 개발자 관점에서 보면 탐지 시스템은 파일 내의 특정 패턴을 찾는 방식인데, 이 패턴이 정교하게 제거되면 시스템은 해당 파일을 일반 사진으로 오판하게 된다.
중요한 점은 이미지라는 결과물에서 흔적을 지웠다고 해서 생성자의 서버 기록까지 사라지는 것은 아니라는 사실이다. 비유하자면 제품에 붙은 정품 인증 스티커를 떼어냈다고 해서 공장의 출고 장부에서 구매자의 이름이 지워지지 않는 것과 같다. 구글 서버에 저장된 계정 히스토리나 백업 데이터, 혹은 생성 과정에서 업로드된 스크린샷 등은 여전히 남아 있다. 만약 원본 파일이 생성자의 계정 기록에 남아 있거나 구글 서비스 내에서 공유된 적이 있다면, 구글은 워터마크가 제거된 복제본이라 할지라도 이를 특정 계정과 연결할 수 있는 능력을 유지한다. 결국 이미지 파일이라는 껍데기는 바꿀 수 있어도, 생성이라는 사건 자체가 기록된 서버의 로그는 사용자가 제어할 수 없는 영역에 존재한다.
이러한 간극은 단순한 기술적 논쟁을 넘어 법적 리스크로 이어진다. AI가 만든 결과물을 마치 사람이 직접 그린 창작물인 것처럼 속여 배포하는 행위는 국가별 규제뿐 아니라 DMCA(디지털 밀레니엄 저작권법, 미국의 저작권 보호법) 위반 가능성을 내포한다. 특히 상업적 이득을 위해 AI 생성물을 인간의 순수 창작물로 위장하는 경우, 이는 단순한 약관 위반을 넘어 법적 분쟁의 핵심 증거가 될 수 있다. 기술적으로 라벨을 떼어내는 것은 찰나의 순간에 가능하지만, 그 행위가 가져올 법적 책임과 신뢰도 하락이라는 비용은 매우 길고 무겁게 작용한다. 실무자나 창작자 입장에서는 자동 탐지 시스템을 피했다는 일시적인 안도감이 오히려 나중에 더 큰 법적 함정이 될 수 있는 구조다.




