이번 주에도 천문학자들이 밤하늘을 보며 “이게 뭘 뜻하지?”를 따지는 장면이 이어졌다. 다만 이번엔 망원경이 사진을 가져다준 게 아니라, 데이터가 쏟아져 들어오는 상황이었다. 2022년 James Webb Space Telescope(JWST)가 처음으로 데이터를 돌려주기 시작했을 때, 하늘은 ‘테라바이트’ 단위로 도착했다.
2022년 JWST 초기 데이터가 ‘테라바이트’로 쏟아졌다
2022년 JWST의 첫 이미지 데이터가 반환되기 시작했을 때, Brant Robertson과 동료들은 기존처럼 하늘을 관찰하고 해석하려 했다. 이번에는 관측 결과가 “terabytes”로 들어왔다. Robertson은 “은하가 사방에 있었다”고 회상했으며, 너무 많고 너무 멀어서 “진짜로 놀랐다”고 말했다. 그는 University of California, Santa Cruz에서 Big Bang 이후 가장 초기 은하가 어떻게 형성됐는지 연구하는 팀을 이끈다. 또한 그의 팀은 공개 데이터셋을 내놓아, 올해 Spring Astronomy Day를 맞아 이전보다 더 깊게 초기 우주를 탐색할 수 있게 됐다.
예전엔 관측이 먼저였고, 이제는 계산이 관측을 따라간다
예전에는 관측자가 하늘을 보고, 그 결과를 사람이 이해 가능한 형태로 정리하는 흐름이 중심이었다. 그런데 이번엔 “데이터가 너무 크고 복잡해서 사람이 손으로 분석하기 어렵다”는 문제가 바로 드러났다. Robertson은 전문가 팀이라도 예전에는 수년이 걸릴 일을, 이제는 며칠 안에 처리해야 한다고 말했다. 비유하자면, 예전엔 지도 한 장을 펴고 길을 찾는 일이었다면, 지금은 지도 전체가 파일로 와서 컴퓨터가 먼저 길을 ‘분류’해 줘야 하는 단계로 바뀐 셈이다. 관측에는 한계가 있고, 그 한계를 맞추려면 계산이 필요하다는 점도 같은 맥락에서 강조됐다.
Copernicus처럼, Robertson도 ‘계산 모델’로 관측 불일치를 푼다
관측만으로는 서로 안 맞는 부분이 생기기 때문에 계산이 필요하다고 설명했다. 원문은 Copernicus가 관측에서 생기는 불일치를 수학으로 정리했다고 말한다. Robertson은 같은 방식으로, 이번에는 computational models(계산 모델)로 관측의 요구를 맞춘다고 했다. JWST는 지금까지 발사된 관측 장비 중 가장 강력하다고 했고, 적외선에서 관측해 130억 년 이상 이동한 빛을 담아낸다고 했다. 딥필드(deep-field) 이미지는 수십만 개 규모의 은하가 빽빽하게 들어 있는 장면을 제공하며, 그중에는 130억 년 전의 은하도 포함된다고 했다. 다만 은하가 너무 많다는 “풍부함”이 오히려 분석의 병목이 됐다고 했다.
개발자·연구자가 체감하는 변화는 ‘며칠 처리’로의 압축이다
개발자나 연구자가 바로 체감하는 변화는, 데이터가 쌓이는 속도와 사람이 처리하는 속도의 격차가 더 커졌다는 점이다. Robertson은 “이 데이터셋은 인간이 손으로 분석하기엔 너무 크고 복잡하다”고 못 박았다. 그래서 관측 결과를 해석하는 과정에서, 계산이 관측을 따라가는 구조가 더 강해졌다고 볼 수 있다. 결국 초기 우주를 이해하는 일은 망원경만의 승부가 아니라, 대규모 계산으로 관측을 ‘해독’하는 승부로 옮겨갔다.




