이번 주 천문학 커뮤니티에서는 제임스 웹 우주 망원경(James Webb Space Telescope)이 포착한 초기 우주의 원반 은하 이미지 분석 결과가 큰 화제가 되었다. 수십억 년 전 형성된 은하들의 예상치 못한 모습은 우주 진화 이론에 새로운 질문을 던졌으며, 이러한 발견의 배경에는 방대한 데이터를 처리하는 새로운 기술의 역할이 주목받고 있다. 전통적인 관측 방식으로는 상상하기 어려웠던 규모의 데이터가 쏟아지면서, 연구자들은 미지의 영역을 탐색하는 동시에 데이터 홍수라는 현실적 과제에 직면하고 있다.
천문학 데이터, 2만 테라바이트 시대로
미국 항공우주국(NASA)은 낸시 그레이스 로만 우주 망원경(Nancy Grace Roman Space Telescope)을 2026년 9월에 발사할 계획이며, 이는 당초 예정보다 8개월 앞당겨진 일정이다. 이 새로운 우주 망원경은 수명 기간 동안 천문학자들에게 총 20,000테라바이트에 달하는 데이터를 제공할 것으로 예상된다. 이는 2021년부터 가동을 시작한 제임스 웹 우주 망원경이 매일 57기가바이트의 고해상도 이미지를 전송하고 있는 상황에 더해진다. 또한, 올해 말 칠레 산악 지대에서 관측을 시작할 베라 C. 루빈 천문대(Vera C. Rubin Observatory)는 매일 밤 20테라바이트의 데이터를 수집할 것으로 전망된다.
과거 천문학 관측의 표준이었던 허블 우주 망원경(Hubble Space Telescope)이 하루 1~2기가바이트의 센서 데이터를 제공했던 것과 비교하면, 이러한 데이터량은 전례 없는 수준이다. 캘리포니아 대학교 산타크루즈(UC Santa Cruz)의 천체물리학자 브랜트 로버트슨(Brant Robertson)은 지난 15년간 엔비디아(Nvidia, GPU 제조사)와 협력하며 이러한 과학 분야의 변화를 최전선에서 경험해왔다. 그는 초기에는 초신성 폭발 이론을 검증하는 고급 시뮬레이션에 GPU를 적용했으며, 현재는 최신 관측소에서 쏟아지는 방대한 데이터를 분석하는 도구를 개발하는 데 집중하고 있다. 로버트슨과 당시 대학원생 라이언 하우젠(Ryan Hausen)은 대규모 데이터 세트에서 은하를 식별할 수 있는 딥러닝 모델인 모피어스(Morpheus)를 개발했다. 이 모델은 제임스 웹 망원경 데이터의 초기 분석에서 예상보다 많은 특정 유형의 원반 은하를 식별하여, 우리 우주의 발달 이론에 새로운 관점을 제시했다.
AI 모델, 트랜스포머로 진화하며 GPU 수요 폭증
천문학 연구의 데이터 처리 방식은 소수의 객체를 수동으로 분석하던 단계에서, CPU 기반의 대규모 데이터 세트 분석을 거쳐, 이제는 GPU 가속 기반의 동일한 분석 방식으로 진화하고 있음이 관찰된다. 모피어스 모델의 아키텍처 변화는 이러한 흐름을 명확히 보여준다. 기존의 컨볼루션 신경망(CNN, 이미지 처리용 AI 모델)에서 대규모 언어 모델(LLM)의 기반이 되는 트랜스포머(Transformer, 병렬 처리와 장거리 의존성 학습에 강한 AI 아키텍처)로 전환되고 있다. 이러한 전환은 모델이 현재보다 몇 배 더 넓은 영역을 분석할 수 있게 하여 작업 속도를 크게 향상시킬 것으로 제안된다.
또한, 로버트슨은 지구 대기에 의해 왜곡되는 지상 망원경 관측의 품질을 향상시키기 위해 우주 망원경 데이터로 훈련된 생성형 AI 모델을 연구하고 있다. 8미터급 거울을 궤도에 올리는 것이 여전히 어려운 현실에서, 소프트웨어적으로 베라 C. 루빈 천문대의 관측 데이터를 개선하는 것이 차선책으로 고려되는 것이다. 그러나 이러한 AI 및 머신러닝(ML) 분석에 필수적인 GPU 자원 확보는 전 세계적인 수요 증가로 인해 어려움을 겪고 있다. 로버트슨은 국립과학재단(NSF, 미국의 독립 연방 기관)의 지원으로 캘리포니아 대학교 산타크루즈에 GPU 클러스터를 구축했지만, 더 많은 연구자들이 컴퓨팅 집약적인 기술을 적용하려 하면서도 클러스터는 빠르게 노후화되고 있는 상황이다. 이는 천문학 분야가 최첨단 기술의 경계에서 컴퓨팅 자원 제약이라는 현실적 문제에 직면하고 있음을 시사한다. 대학과 같은 기관은 자원 제약으로 인해 위험 회피적인 경향이 있어, 연구자들이 직접 기술의 방향성을 제시하고 자원을 확보해야 하는 상황이 관찰된다.
우주를 탐색하는 인류의 시선이 확장될수록, 그 시선을 지탱하는 컴퓨팅 인프라의 한계는 더욱 명확해질 것이다.




