세대 AI 인프라는 모든 구성요소를 식히는 100% 액체 냉각

데이터센터 내부의 소음은 귀 보호 장비 없이는 견디기 힘들 정도로 높다. 수만 개의 냉각 팬이 쉼 없이 회전하며 칩의 열을 식히는 물리적 구조 때문이다. NVIDIA Rubin 세대 AI 인프라는 모든 칩과 네트워킹 구성요소를 액체로 식히는 100% 액체 냉각을 구현해 시스템 내 모든 팬을 제거했다.

이 방식은 AI 팩토리 인프라 스택의 설계, 구축, 운영 모범 사례를 정의한 NVIDIA DSX(Data Center System) AI 팩토리 참조 설계에 포함됐다. 칩뿐만 아니라 네트워킹 구성요소까지 전부 액체 냉각 범위에 포함해 열 관리 효율을 높였다. 시스템 어디에도 물리적인 냉각 팬이 존재하지 않는 구조를 달성한 것이 핵심이다.

공랭 인프라 제거는 서버 랙의 밀도 향상과 공간 효율성 개선으로 이어졌다. 기존에 6U(Unit, 서버 랙 표준 높이 단위)를 차지하던 시스템이 2U로 줄어들어 더 적은 공간에서 더 많은 컴퓨팅 자원을 배치할 수 있다. 팬이 사라지면서 소음은 줄고 컴퓨팅 밀도는 높아졌다.

Rubin 서버는 외관 설계에서도 공랭 서버와 명확한 대조를 이룬다. 공기 흐름을 위해 구멍을 뚫었던 기존 공랭 서버의 베젤 대신 깨끗하고 밀폐된 전면 패널을 적용했다. 이는 냉각 팬과 공랭식 인프라를 완전히 제거함으로써 가능해진 설계 변경이며, 결과적으로 서버 랙의 공간 효율을 극대화했다.

냉각액을 최대 45°C로 운용하여 칠러 의존도를 낮추고 냉각

귀 보호 장비가 필요할 정도의 냉각 팬 소음과 막대한 전력 소비는 데이터센터 현장의 고질적인 문제였다. 엔지니어는 냉각액 운용 온도를 최대 45°C, 즉 113°F까지 높이는 설정으로 대응했다. 45°C의 냉각액이 완전 액체 냉각 칩에 투입되어 칩 표면의 열을 흡수하면 약 55°C로 배출된다. 이 온도 범위는 검증된 동작 한계 내에 있어 성능 저하 없이 작동한다. 이를 통해 많은 기후 조건에서 기계식 칠러(냉각수를 강제로 식히는 냉동기)나 소음이 심한 팬을 가동하지 않고도 시설 루프만으로 열을 배출할 수 있다.

냉각 효율을 결정하는 핵심은 물 75%와 프로필렌글리콜(부동액의 일종) 25%로 구성된 냉각액의 조성이다. 이 액체가 프로세서 위에 직접 놓인 콜드 플레이트(열전달 판)를 통과하며 열을 원천에서 직접 흡수하는 구조다. 이후 냉각분배장치가 원천에서 잡은 열을 건물 밖의 대형 라디에이터 코일 형태인 드라이 쿨러(공기로 냉각하는 장치)로 보내 외부로 배출한다. 칠러 의존도를 낮춰 냉각 비용과 전력 소모를 줄인 설계다.

드라이 쿨러 기반의 폐쇄 루프 설계를 통해 데이터센터 물

기존 냉각 시스템이 막대한 양의 물을 증발시켜 열을 식혔다면, 새로운 방식은 물의 소모를 원천적으로 차단한다. 드라이 쿨러(외부 공기를 이용해 냉각액을 식히는 장치) 기반의 폐쇄 루프 시스템을 도입해 증발식 물 냉각 과정을 완전히 배제했다. 기후 조건이 유리한 환경에서는 기존 냉각탑 기반 시스템이 연간 메가와트당 소비하던 약 260만 갤런의 물 사용량을 최대 100%까지 절감할 수 있다. 이는 데이터센터 운영에 필요한 수자원 의존도를 사실상 0으로 낮춘 결과다.

액체 냉각 인프라로의 전환은 운영 비용의 직접적인 감소로 이어진다. 50MW급 하이퍼스케일(초대형 데이터센터) 시설을 기준으로 냉각 관련 에너지와 물 비용을 연간 400만 달러 이상 절감할 수 있다. 칠러 플랜트(냉각수를 생산하는 설비) 온도를 1°C 높일 때마다 냉각 에너지 비용을 약 4% 줄일 수 있다는 업계 추정치가 이를 뒷받침한다. 냉각 효율의 상승이 데이터센터 유지 비용의 하락으로 직결되는 구조다.

폐쇄 루프 설계는 환경적 부담과 경제적 비용을 동시에 해결하는 장치로 작동한다. 연간 메가와트당 260만 갤런의 물 절감 수치와 50MW 시설 기준 400만 달러의 비용 절감액은 액체 냉각 전환의 실질적인 이득을 증명한다. 칠러 온도 1°C 상승에 따른 4%의 비용 감소 효과는 정밀한 온도 제어가 곧 수익성 개선으로 연결됨을 보여준다.

귀 보호 장비가 필요했던 냉각 팬 소음과 전력 낭비는 100% 액체 냉각의 도입으로 사라진다. 45°C 냉각액과 드라이 쿨러 기반의 폐쇄 루프 구조는 칠러라는 물리적 제약을 제거했다. 50MW급 시설 기준 연간 400만 달러 이상의 냉각 비용 절감 가능 여부를 검토하는 것이 실질적인 도입 판단 기준이다. 인프라의 경제성은 이제 냉각 효율이 결정한다.