발표에서 확인된 핵심 사실
AI 서비스를 운영하는 기업들이 가장 골머리를 앓는 지점은 칩 가격과 추론 속도다. 엔비디아 GPU가 시장을 꽉 잡고 있지만, 정작 서비스를 돌릴 때 드는 비용과 시간이라는 병목 현상은 여전하다. 이 틈을 파고든 AI 칩 스타트업 Etched가 10억 달러 규모의 계약 주문을 확보하며 시장의 주목을 받고 있다.
2022년 설립된 Etched는 TSMC가 올해 초 칩 제조에 성공한 이후 단순한 칩 판매를 넘어선 전략을 세웠다. 칩과 맞춤형 랙, 소프트웨어를 하나로 묶은 프런티어 추론 클러스터(frontier inference clusters, 칩부터 서버 거치대와 구동 프로그램까지 통합한 시스템)를 공급하며 10억 달러의 수주 잔고를 쌓았다. 하드웨어 단품이 아니라 서비스 운영에 필요한 전체 인프라를 패키지로 제공하는 구조다.
자금 조달 속도 역시 가파르다. Etched는 현재까지 총 8억 달러의 투자금을 유치했으며, 작년 12월에는 비공개로 5억 달러 규모의 투자 라운드를 마감했다. 이 과정에서 기업 가치는 50억 달러(포스트 머니 밸류에이션, 투자 후 기업 가치)로 책정됐다. 특정 작업에만 최적화된 전용 칩(ASIC, 주문형 반도체) 기반의 시스템이 대규모 서비스의 비용 효율을 얼마나 높일 수 있을지가 이번 투자의 핵심 판단 기준이 됐다.
제품은 프런티어 모델의 추론(inference) 속도와 비용
AI 서비스를 운영할 때 가장 돈이 많이 드는 곳은 어디일까? 정답은 사용자가 질문을 던진 뒤 AI가 답을 내놓는 추론(inference) 단계다. 현재 AI 기업들이 대규모 서비스를 제공할 때 겪는 가장 큰 병목 구간이자 비용이 집중되는 지점이기도 하다. Etched는 이 문제를 풀기 위해 칩과 맞춤형 랙, 소프트웨어를 하나로 묶은 프런티어 추론 클러스터(frontier inference clusters)를 내놓았다. 부품 하나가 아니라 칩부터 이를 꽂는 선반과 구동 프로그램까지 세트로 맞춘 통합 시스템이다. 경쟁사보다 더 빠르고 저렴하게, 전력은 덜 쓰면서 답을 내놓도록 설계해 운영 효율을 극대화했다.
Cerebras는 올해 첫 주목받는 기업공개(IPO)를 마쳤고 Groq은 6억 5천만 달러의 투자를 유치하며 시장의 관심을 끌었다. 아마존, 구글, 마이크로소프트 같은 하이퍼스케일러(초대형 클라우드 사업자)들도 외부 의존도를 낮추려 자체 AI 칩을 직접 구축하고 있다. OpenAI 역시 브로드컴(Broadcom)과 협력해 첫 커스텀 칩을 발표하며 하드웨어 내재화에 나섰다. 추론 전용 칩 시장이 스타트업과 빅테크 기업 간의 치열한 생존 경쟁 구도로 빠르게 재편되는 중이다.
범용 GPU가 여러 일을 두루 잘하는 다목적 도구라면, Etched가 지향하는 전용 칩(ASIC, 특정 작업만 수행하도록 설계한 집적 회로) 기반 시스템은 오직 추론이라는 한 가지 작업에만 모든 자원을 쏟아붓는다. 특정 용도에 맞게 회로를 짠 칩과 전용 소프트웨어가 결합된 시스템이 실제 대규모 서비스의 비용과 성능을 얼마나 획기적으로 개선할 수 있을지가 앞으로의 핵심 판단 기준이 된다.
투자금과 참여 투자자가 보여주는 신호
대다수 투자자가 범용 GPU(그래픽 처리 장치, 여러 작업을 두루 처리하는 그래픽 연산 칩)의 시장 지배력을 의심하지 않을 때, 누군가는 칩의 설계 구조를 밑바닥부터 다시 짜야 한다고 주장했다. 2023년 당시 Etched의 공동 창업자 Gavin Uberti와 Robert Wachen은 30페이지 분량의 기획서를 들고 투자자를 찾아다녔으나, 모든 주요 투자사로부터 거절당하며 자금 고갈 위기를 겪었다. 하버드 대학교를 중퇴한 두 창업자는 Thiel fellows(피터 틸이 후원하는 청년 창업가 프로그램)로 선정되어 회사를 설립했지만, 당시에는 AI가 범용 칩이 아닌 전용 칩을 필요로 한다는 그들의 논리를 받아들이는 곳이 없었다.
상황은 반전되었다. 현재 Etched는 VentureTech Alliance, Jane Street, Hudson River Trading, Two Sigma, Ribbit Capital과 같은 주요 투자사로부터 대규모 자금을 유치했다. 여기에 억만장자 Stanley Druckenmiller와 Peter Thiel이 투자자로 이름을 올리며 자금줄을 텄다. 단순히 자본만 모인 것이 아니다. Andrej Karpathy, Geoffrey Hinton, Fei-Fei Li, Arthur Mensch, Scott Wu와 같은 AI 분야의 거물들이 직접 엔젤 투자자(초기 단계의 스타트업에 자금을 대는 개인 투자자)로 참여하며 기술적 신뢰도를 더했다.
이러한 투자자 구성은 단순히 유망한 기업을 향한 자금 흐름을 넘어, AI 서비스의 효율을 극대화하려는 기술적 방향성에 대한 시장의 응답이다. 범용 칩의 한계를 지적하며 시작된 이들의 도전은 이제 업계 최고 전문가들의 지지를 받는 시스템으로 자리 잡았다.
범용 GPU가 만능 해결사로 군림하던 시대는 저물고, 이제는 특정 작업만을 위해 설계된 전용 칩이 서비스의 경제성을 좌우하는 시대로 접어들었다. 단순히 칩의 성능을 비교하는 것을 넘어, 하드웨어와 소프트웨어가 얼마나 긴밀하게 맞물려 추론 비용을 낮추는지가 기업의 경쟁력을 결정하는 잣대가 될 것이다. 서비스 운영 비용을 획기적으로 줄이고 싶다면, 범용 칩의 화려한 스펙 뒤에 숨겨진 실제 운영 효율과 특정 작업 최적화 수준을 가장 먼저 따져봐야 한다.




