포토북 표지에 프랑스 2024나 사진들 같은 단순한 제목이 적혀 있다. 대부분의 사용자는 전문 카피라이터가 아니기에 단순한 지명이나 날짜를 입력하는 수준에 그친다. 이는 제품의 전체적인 디자인 완성도를 떨어뜨리는 요인이 된다.

Popsa(포토북 제작 서비스 기업)는 Amazon Bedrock(클라우드 기반 AI 서비스)과 Amazon Nova(아마존의 최신 거대언어모델 제품군)를 도입해 제목 추천 기능을 재설계했다. 이 시스템은 메타데이터, 컴퓨터 비전, RAG(검색 증강 생성) 기술을 결합해 12개 언어로 브랜드 정체성에 맞는 제목과 부제목을 자동 생성한다. Amazon Bedrock의 통합 API를 통해 Anthropic의 Claude 3 Haiku와 Amazon Nova Lite, Pro 모델을 교체하며 테스트했다. 그 결과 2025년 한 해 동안 550만 건 이상의 개인화된 제목이 생성되었다.

Amazon Nova와 Claude 3 Haiku의 성능 지표

개발팀이 구축한 평가 파이프라인은 100개 이상의 포토북 예시 데이터셋을 기반으로 작동한다. 모델의 성능을 측정하기 위해 LLM-as-a-judge(AI 모델이 다른 AI의 결과물을 평가하는 방식) 기법을 도입했다. 이를 통해 모델의 응답이 브랜드 가이드라인을 준수하는지, 문법적으로 정확한지, 그리고 사용자의 사진 맥락을 정확히 반영하는지 검증했다.

주목할 점은 Retrieval-based few-shot prompting(유사 사례를 찾아 모델에 제공해 정확도를 높이는 기법)의 효율성이다. 시스템은 새로운 포토북 디자인이 들어오면 데이터베이스에서 유사한 디자인과 성공적인 제목 사례를 검색한다. 이후 <user>와 <assistant> 메시지 형태로 예시를 먼저 제공하고 마지막에 사용자의 디자인 문서를 추가하는 방식으로 모델이 이전 응답 패턴을 모방하게 만들었다. 반면 Amazon Nova 제품군은 200개 이상의 언어를 지원하며 낮은 지연 시간을 기록했다.

그래프 알고리즘에서 생성형 AI로의 전환

예전에는 Title Suggestion Graph(규칙 기반의 제목 생성 알고리즘)를 통해 정해진 템플릿에 따라 제목을 추천했다. 예를 들어 모든 사진이 같은 날 촬영되었다면 온 디스 데이(On this Day)라는 제목과 해당 날짜를 부제목으로 제안하는 식이었다. 그러나 이러한 방식은 창의성이 부족하고 정형화된 결과물만 내놓는 한계가 있었다.

이제는 데이터 추출부터 생성까지의 과정이 완전히 달라졌다. 제목 추천 서비스가 요청을 받으면 먼저 디자인 파일의 타임스탬프를 복호화하고 처리한다. 이어 위경도 좌표를 주소로 변환하는 Reverse geocoding(역 지오코딩) 작업을 수행하며, CNN(이미지 특징을 추출하는 인공신경망)을 통해 랜드마크나 객체를 분류한다. 이렇게 생성된 알프스에서 2025년 1월 21일부터 23일 사이에 촬영된 사진 21장이 포함된 스키 포토북이라는 구체적인 묘사 문구가 LLM의 입력값으로 들어간다.

결과적으로 사용자 피드백은 수치로 증명되었다. 그래프 알고리즘에서 Claude 3 Haiku로 전환한 후 긍정적인 사용자 피드백 비율이 58%에서 71%로 13%p 상승했다. 수십만 명의 사용자를 대상으로 진행한 다변량 테스트에서도 생성형 AI 기반의 제목이 디자인 생성률과 실제 구매율을 유의미하게 높이는 것으로 나타났다. 하지만 최근에는 Amazon Bedrock의 통합 API를 통해 모델 ID만 변경함으로써 Nova 모델의 성능을 빠르게 검증하며 비용과 속도를 추가로 최적화하고 있다.

단순한 텍스트 생성을 넘어 데이터 추출과 검색 기반 프롬프팅의 결합이 실질적인 구매 전환으로 이어졌다.