하드웨어 제약을 극복한 범용 인코더 디바인의 등장
고성능 AI 로봇을 구동하기 위해 개발자들은 무거운 연산 장치를 로봇에 직접 탑재하거나 외부 서버와의 연결을 필수적으로 유지해야 했다. 이러한 하드웨어 의존성은 로봇의 무게를 증가시켜 배터리 효율을 떨어뜨리고, 서버 연결 상태에 따라 로봇의 반응 속도가 느려지는 물리적 제약을 발생시켰다. 네이버랩스 유럽(NAVER LABS Europe)은 23일 이미지 이해, 공간 및 사람 인식 기능을 하나로 통합한 범용 인코더 '디바인(DIVINE)'을 공개했다. 인코더는 로봇이 카메라나 라이다(LiDAR) 등의 센서를 통해 수집한 데이터를 AI 모델이 처리할 수 있는 수치 형태로 변환하는 장치다. 기존 자율주행 로봇은 위치 추정, 깊이 계산, 공간 이해, 사람 인식 등 각 작업마다 별도의 AI 모델과 인코더를 활용해 동일한 입력 데이터를 여러 번 중복 처리해 왔으며, 이로 인해 메모리 사용량과 연산량이 과도하게 증가하는 문제를 겪었다.
다중 교사 증류를 통한 전문가 지식의 단일 모델 응축
네이버랩스 유럽은 여러 전문 모델의 핵심 지식을 하나의 모델에 이식하는 '다중 교사 증류(multi-teacher distillation)' 방식을 통해 연산 효율 문제를 해결했다. 다중 교사 증류는 이미지, 공간, 사람 인식 등 각 분야에 특화된 전문가 '교사' 모델들로부터 핵심적인 지식만 추출해 하나의 '학생' 모델에 이식하는 기술이다. 디바인은 이 방식을 적용해 2D 이미지 이해와 3D 공간 재구성, 사람 인식 등을 각각 전문으로 처리하던 여러 인코더의 기능을 하나로 응축했다. 학생 모델은 교사 모델들이 보유한 방대한 파라미터 규모를 그대로 갖지 않고도, 전문가 모델의 핵심 처리 능력을 이어받아 다양한 분야를 두루 처리할 수 있는 지능을 갖추게 된다. 결과적으로 로봇은 여러 개의 대형 전문가 모델을 개별적으로 탑재할 필요 없이, 디바인이라는 단일 학생 모델만으로 복잡한 시각 AI 작업을 동시에 수행한다.
중복 연산 제거로 달성한 메모리 절감과 처리 속도 향상
디바인은 단일 인코더 체제로의 전환을 통해 데이터 처리 경로를 단순화하고 시스템 자원 낭비를 제거했다. 실제 실험 환경에서 디바인을 동작시킨 결과, 여러 개의 인코더를 개별적으로 탑재했을 때와 비교해 인코더 메모리 사용량을 90%가량 절감했다. 데이터 변환 과정의 효율이 극대화되면서 인코딩의 처리 속도는 기존 방식보다 최대 12배까지 향상된 것으로 나타났다. 로봇 시스템 전반의 메모리 사용량은 약 62% 감소했으며, 시스템 전체의 처리 속도는 최대 4배까지 향상되어 주변 환경에 대한 인식 주기가 짧아졌다. 이러한 수치는 위치 추정이나 깊이 계산 등 작업별로 데이터를 중복해서 처리하던 기존 구조를 제거하고, 단 한 번의 인코딩 과정으로 다양한 AI 작업을 처리하는 통합 구조를 완성했기에 가능했다. 특히 사람과 로봇이 공존하는 환경에서 제한된 컴퓨팅 자원으로도 주변 상황을 빠르게 인식하고 즉각적으로 대응할 수 있는 기반을 마련했다.
온보드 AI 구현을 통한 피지컬 AI 상용화의 실무적 기준
디바인은 고가의 하드웨어 없이 로봇 자체에서 고성능 AI를 구동하는 '온보드(On-board)' 환경의 실무적 활용성을 높였다. 온보드는 외부 서버의 도움 없이 로봇 내부의 임베디드 장치에서 AI 기능을 직접 실행하는 환경을 의미한다. 개발자는 비싸고 무거운 연산 장치를 갖춘 대형 하드웨어 없이도, '빠르고 똑똑한 뇌'인 디바인을 장착해 스스로 상황을 파악하는 자율주행 AI 로봇을 운용할 수 있다. 또한 디바인은 새로운 AI 기능을 쉽게 추가할 수 있도록 설계되어, AI 모델이 업그레이드될 때마다 새로운 로봇을 도입하지 않고 기존 로봇의 디바인을 업데이트하는 것만으로 성능을 개선할 수 있다. 네이버랩스 유럽의 디바인 관련 연구 2건은 2024 유럽컴퓨터비전학회(ECCV)와 2025 컴퓨터비전 및 패턴 인식 컨퍼런스(CVPR)에서 채택되며 글로벌 수준의 기술력을 입증했다. 네이버랩스 비전그룹 이동환 리더는 디바인이 일상 및 산업 현장 전반에 걸쳐 AI 로봇 도입 장벽을 낮추는 데 기여할 것이라고 밝혔다.




