유럽 첫 엑사스케일 슈퍼컴퓨터 JUPITER, 4대 과학 난제 돌파

유럽 최초 엑사스케일 시스템 JUPITER의 등장과 4대 핵심 프로젝트

대규모 AI 모델을 학습시키거나 복잡한 과학 시뮬레이션을 돌릴 때, 하드웨어 성능 한계로 연구가 중단되거나 결과 도출이 무한정 지연되는 상황은 연구자들에게 익숙한 불편이다. 데이터 규모가 커질수록 메모리 부족이나 연산 속도 저하라는 벽에 부딪혀 모델의 정밀도를 낮추거나 분석 범위를 축소해야만 했다. 독일 Forschungszentrum Jülich에 구축된 유럽 최초의 엑사스케일 슈퍼컴퓨터 JUPITER는 이러한 하드웨어 제약을 제거해 복잡도 높은 과학적 과제를 실무 생산 수준에서 처리한다. 엑사스케일은 초당 100경 번 이상의 부동소수점 연산을 수행하는 컴퓨팅 규모를 뜻하며, 이는 기존 시스템으로는 수십 년이 걸릴 계산을 며칠 단위로 단축하는 기반이 된다.

JUPITER의 하드웨어 핵심은 NVIDIA Grace Hopper Superchips와 NVIDIA Quantum-X800 InfiniBand 네트워킹이다. 인피니밴드(InfiniBand)는 서버 간 데이터 전송 지연을 최소화하고 대역폭을 극대화하는 고속 네트워킹 기술이다. 이 시스템은 단순한 연산 속도 향상을 넘어, CPU와 GPU가 메모리를 효율적으로 공유하는 구조를 통해 기존 슈퍼컴퓨터로는 접근 불가능했던 거대 데이터셋을 처리하는 인프라로 작동한다. 이를 통해 연구자는 데이터 전송 병목 현상 없이 엑사스케일급 연산 자원을 온전히 활용할 수 있다.

현재 JUPITER에서는 네 가지 핵심 프로젝트가 구동 중이다. 뇌 미세구조 분석을 위한 파운데이션 모델인 CytoNet 개발이 진행되고 있으며, 지구 기후를 1km 해상도로 시뮬레이션하는 ICON 모델이 작동한다. ICON 모델은 해양, 대기, 지표면뿐만 아니라 생지화학 및 탄소 순환까지 포함한 지구 시스템 전체를 통합 시뮬레이션한다. 또한 에릭슨과 협력해 5G 및 6G 네트워크 최적화를 위한 AI 모델 학습을 수행하며, 특히 에너지 비용을 낮추기 위한 뉴로모픽(Neuromorphic, 뇌 구조 모사) 접근 방식의 AI 추론을 연구한다. 마지막으로 50큐비트 규모의 범용 양자 컴퓨터 시뮬레이션을 처리한다. 큐비트(Qubit)는 양자 정보의 기본 단위이며, 이를 시뮬레이션하는 것은 미래 양자 하드웨어가 실행할 알고리즘을 설계하고 스트레스 테스트를 수행하는 필수 과정이다.

이 프로젝트들은 엑사스케일 컴퓨팅이 단순한 연구용 장비를 넘어 대규모 AI 학습과 복잡계 시뮬레이션을 위한 실무 생산 인프라로 전환되었음을 보여주는 판단 기준이 된다. 물리 법칙을 근사치로 계산하여 오차를 감수하던 방식에서 벗어나, 미세한 상호작용을 직접 계산하는 환경이 구축된 것이다. JUPITER는 뉴런 분석부터 지구 대기, 무선 통신망, 양자 역학까지 광범위한 과학 영역을 하나의 인프라에서 처리하며 하드웨어 성능이 연구의 한계를 결정하던 시대를 끝내고 실질적인 결과물을 도출하는 생산 도구로 자리 잡았다.

6.5페타바이트 데이터를 5일 만에, 뇌 구조 분석 모델 CytoNet

복잡한 뇌 지도를 그리는 일은 단순히 데이터를 모으는 것을 넘어, 수조 개의 연결 고리를 일일이 확인해야 하는 지난한 과정이다. 기존의 컴퓨팅 자원으로는 860억 개의 신경세포가 얽힌 뇌의 미세구조를 단일 세포 단위로 분석하는 것이 사실상 불가능했다. 하지만 JUPITER(유럽 최초의 엑사스케일 슈퍼컴퓨터)의 연산 능력을 활용한 CytoNet(뇌 미세구조 분석을 위한 파운데이션 모델)은 이러한 한계를 기술적으로 돌파했다.

CytoNet은 21개의 사후 뇌 데이터를 학습하여 뇌의 세포 구조와 조직 패턴을 연결하는 지도를 구축한다. 이 모델의 학습에는 총 6.5페타바이트 규모의 방대한 데이터가 투입되었다. 연구진은 4,096개의 NVIDIA Grace Hopper Superchips(CPU와 GPU를 하나의 모듈로 통합한 고성능 연산 칩)를 활용하여 이 거대한 데이터를 5일 이내에 학습 완료했다. 해당 연구의 상세 내용은 arXiv(학술 논문 사전 공개 사이트)를 통해 공개되었다.

이 시스템의 핵심은 대규모 데이터 처리를 뒷받침하는 효율적인 메모리 관리 구조에 있다. JUPITER는 GPU 메모리 용량을 초과하는 데이터가 발생할 경우, 이를 CPU 메모리로 즉시 스필오버(Spillover, 데이터가 넘칠 때 다른 저장 공간으로 자동으로 이동하는 현상)하여 연산 중단 없이 처리를 이어간다. 이러한 아키텍처 덕분에 연구진은 데이터 병목 현상을 최소화하며 복잡한 신경과학 모델을 안정적으로 학습시킬 수 있었다.

연구진은 여기서 멈추지 않고, 단순히 데이터를 분석하는 도구를 넘어 실험을 스스로 설계하는 AI 에이전트 개발을 차기 목표로 설정했다. 이 에이전트는 NVIDIA Nemotron 3 120B(다양한 추론과 언어 인터페이스를 지원하는 대규모 언어 모델)를 통합하여 다중 모달 추론과 질의응답 기능을 수행할 예정이다. 결과적으로 CytoNet은 신경과학 연구자가 AI와 직접 대화하며 뇌 데이터를 탐구하는 실무 생산 인프라의 가능성을 제시한다.

1km 해상도의 지구 시뮬레이션, 기존 물리 근사치를 넘어서다

유저에게는 무료로 보이는 기상 예보나 기후 데이터 서비스 뒤에는 매 순간 천문학적인 인프라 비용과 연산 자원이 투입된다. 핵심은 이 보이지 않는 비용을 누가, 어떤 정밀도로 감당하여 인류가 직면한 기후 위기의 변수를 통제하느냐에 있다. 기존 기후 모델은 복잡한 자연 현상을 일일이 계산하기 어려워 물리적 근사치, 즉 통계적 추정 값을 사용해 결과를 도출했다. 하지만 JUPITER 슈퍼컴퓨터 위에서 구동되는 ICON 모델은 이러한 근사치의 한계를 넘어 지구 시스템 전체를 1km 해상도로 직접 계산하는 실무 생산 인프라로 전환되었다.

ICON(Icosahedral Nonhydrostatic, 정이십면체 비정역학 모델)은 대기, 해양, 생물지구화학, 탄소 순환을 통합하여 이전 시스템이 근사치로 처리하던 물리적 상호작용을 직접 계산한다. 이 모델은 지난해 11월 SC25(Supercomputing 2025, 고성능 컴퓨팅 학술 대회)에서 Gordon Bell Prize for Climate Modelling을 수상하며 그 기술적 가치를 입증했다. 특히 해양 와류, 상층 해양 혼합과 같이 기존 모델에서는 미세한 오차로 취급되던 물리적 상호작용을 직접 계산함으로써 기후 변화의 핵심 동인을 정밀하게 추적한다. 이러한 능력은 플랑크톤의 증식이나 동물성 플랑크톤의 섭식과 같은 생태계 변화를 시뮬레이션하고 시각화하는 수준까지 도달했다.

해당 시뮬레이션은 20,480개의 NVIDIA Grace Hopper Superchips(CPU와 GPU를 하나의 모듈로 결합한 가속기)를 사용하여 146일치의 기후 데이터를 단 24시간 만에 처리했다. 이는 이전 모델들이 부분적인 물리 현상만을 모델링하던 것과 달리, 전체 지구 시스템을 1km라는 초고해상도로 구현한 세계 최초의 사례다. 연구진은 이러한 연산 구조를 통해 대기, 해양, 생물권이 상호작용하는 방식을 물리 법칙에 기반하여 직접 확인하고 있다. 이는 단순한 연구용 시뮬레이션을 넘어, 기후 변화의 경로를 예측하고 대응 전략을 수립하는 실무적 판단 기준을 제시한다.

50큐비트 양자 시뮬레이션 기록 경신과 메모리 아키텍처의 비밀

복잡한 양자 알고리즘을 설계하고 검증하는 과정에서 하드웨어의 물리적 한계는 연구의 가장 큰 병목 구간으로 작용한다. 특히 양자 상태를 표현하는 데이터의 크기는 큐비트(양자 컴퓨터의 연산 단위) 수가 증가함에 따라 기하급수적으로 커지기 때문에, 기존의 컴퓨팅 자원으로는 시뮬레이션 자체를 수행하기 어려운 경우가 많았다. 이러한 제약을 극복하기 위해 Jülich Supercomputing Centre(JSC, 율리히 슈퍼컴퓨팅 센터)와 NVIDIA Application Lab은 협력하여 50큐비트 규모의 범용 양자 컴퓨터 시뮬레이션에 성공했다. 이는 기존 기록인 48큐비트를 넘어선 세계 최초의 성과다.

이번 기록 경신의 핵심은 JUPITER(유럽 최초의 엑사스케일 슈퍼컴퓨터)가 채택한 NVIDIA GH200 Grace Hopper Superchips(CPU와 GPU를 하나의 모듈로 통합한 고성능 연산 칩)의 메모리 아키텍처에 있다. 일반적으로 대규모 시뮬레이션 데이터가 GPU의 고속 메모리 용량을 초과하면 연산 속도가 급격히 저하되거나 오류가 발생한다. 하지만 JUPITER는 GPU 메모리 한계를 넘어서는 데이터를 CPU 메모리로 즉시 넘겨 처리하는 스필오버(Spillover, 데이터가 넘쳐흘러 다른 저장 공간을 활용하는 현상) 기능을 최적화했다. 이 구조 덕분에 GPU 메모리 용량만으로는 도달할 수 없었던 더 큰 규모의 양자 상태를 시스템 전체 메모리 영역에서 안정적으로 유지할 수 있게 되었다.

이러한 메모리 통합 구조는 단순한 용량 확장을 넘어 성능 손실을 최소화하는 데 기여한다. 데이터를 CPU와 GPU 사이에서 매끄럽게 이동시키는 설계 덕분에, 연구진은 50큐비트라는 전례 없는 규모의 양자 상태를 시뮬레이션 환경 내에서 구현할 수 있었다. 현재 개발된 JUQCS-50(Jülich의 50큐비트 양자 컴퓨터 시뮬레이터)은 JUNIQ(Jülich의 양자 컴퓨터 사용자 시설)를 통해 연구자들에게 공개되어, 차세대 양자 하드웨어가 구동될 알고리즘을 설계하고 스트레스 테스트를 수행하는 강력한 도구로 활용되고 있다.

슈퍼컴퓨팅 인프라가 단순히 연산 속도 경쟁을 넘어, 이처럼 메모리 계층 간의 유연한 데이터 처리를 지원하는 생산 환경으로 진화함에 따라 양자 연구의 실무적 난제들도 해결의 실마리를 찾고 있다. 현재의 양자 하드웨어가 실질적인 문제 해결에서 고전적 컴퓨터를 완전히 대체하지 못하는 상황에서, JUPITER와 같은 시스템은 미래 양자-GPU 슈퍼컴퓨터의 성능을 미리 검증하는 최적의 테스트베드 역할을 수행한다. 이는 슈퍼컴퓨팅이 고립된 연구용 장비를 벗어나, 복잡계 시뮬레이션과 차세대 알고리즘 검증을 위한 실무 생산 인프라로 전환되었음을 보여주는 구체적인 지표다.

6G 네트워크와 에너지 효율적 AI, 산업 현장의 실무적 의미

왜 통신망의 규모가 커질수록 에너지 효율은 떨어지고 운영 복잡도는 기하급수적으로 증가할까? 기존 인프라가 감당하기 어려운 네트워크의 복잡성을 해결하기 위해 에릭슨(Ericsson, 스웨덴의 글로벌 통신 장비 기업)과 Forschungszentrum Jülich(독일의 국립 연구 센터)가 JUPITER를 기반으로 한 공동 연구에 착수했다. 이 협력의 핵심은 5G 네트워크의 진화와 차세대 6G 환경을 뒷받침할 AI 모델을 학습하고 테스트하는 것이다.

연구진은 인간의 뇌가 가진 효율적인 정보 처리 방식을 모방한 뇌 모방 아키텍처(Neuromorphic architecture)를 통신 네트워크 운영에 도입하고 있다. 이는 복잡한 네트워크 연산을 최소한의 전력으로 처리하기 위한 설계다. 특히 무선 엣지(Radio Edge, 데이터가 생성되는 기지국과 단말기 인근의 네트워크 말단) 환경에서 AI 추론(학습된 모델이 새로운 데이터를 분석하여 결과를 도출하는 과정)을 수행할 때 발생하는 에너지 소비를 줄이는 것이 이번 연구의 주된 목표다.

JUPITER는 단순한 학술적 실험 장비를 넘어 이러한 차세대 네트워크 기술을 검증하는 생산 인프라로 기능한다. 연구팀은 JUPITER의 대규모 연산 자원을 활용하여 에릭슨의 무선 및 코어 네트워크를 위한 AI 모델을 학습시킨다. 이 과정에서 Jülich Supercomputing Centre(JSC)가 보유한 모듈형 슈퍼컴퓨팅 아키텍처 개념이 적용되어, 대규모 AI 모델의 학습과 테스트가 실무 환경과 유사한 수준에서 이루어진다.

이러한 시도는 슈퍼컴퓨팅이 고립된 연구실의 전유물에서 벗어나 산업 현장의 실무 생산 인프라로 전환되었음을 보여주는 지표다. 6G 네트워크와 같은 차세대 인프라를 설계하는 과정에서 JUPITER는 대규모 데이터를 빠르게 학습하고 에너지 효율적인 최적화 모델을 도출하는 컴퓨팅 엔진 역할을 수행한다. 연구진은 이를 통해 네트워크 운영의 효율성을 극대화하고, 향후 실제 통신 환경에 적용 가능한 지능형 네트워크 아키텍처를 구축하는 데 집중하고 있다.

하드웨어 성능의 한계로 연구가 중단되거나 지연되던 기존의 제약은 더 이상 유효하지 않다. JUPITER는 4,096개의 NVIDIA Grace Hopper Superchips와 CPU-GPU 통합 메모리 아키텍처를 통해 6.5페타바이트 규모의 뇌 데이터를 5일 이내에 학습하며 엑사스케일 연산의 실효성을 입증했다.

이제 슈퍼컴퓨팅은 단순한 실험실의 연구 도구를 넘어 대규모 AI 학습과 복잡계 시뮬레이션을 즉각적으로 수행하는 실무 생산 인프라로 전환되었다. 인프라의 연산 규모와 메모리 확장성이 연구의 성패를 가르는 실무적 판단 기준이 된다.