15년 만의 반전, 드디어 쓸만해진 애플 Siri의 정체

애플이 시리(Siri)의 새로운 버전을 출시했다

타이머 하나 제대로 맞추지 못해 10년 넘게 사용자들의 조롱을 샀던 음성 비서가 마침내 껍질을 깨고 나왔다. 애플은 기존 시리(Siri)의 성능에 대한 부정적인 평가를 뒤로하고 15년 만에 완전히 개편된 새로운 버전을 공식 출시했다. 원문은 이를 두고 가장 놀라운 일이라고 표현할 만큼, 단순 명령 수행 기기에서 실무적인 자동화 도구로의 급격한 전환을 예고했다. 이는 애플이 OS 내부 데이터와 직접 연동하여 복합적인 작업을 처리하는 새로운 제어 구조를 도입했음을 의미한다.

구글은 260억 개의 파라미터를 가진 오픈 웨이트 확산 모델인 디퓨전 젬마(Diffusion Gemma)를 아파치 2.0 라이선스로 공개하며 기술 경쟁에 불을 지폈다. 기존의 자기회귀 방식이 아닌 확산 방식을 채택한 첫 번째 오픈 웨이트 모델로서, 260억 개의 파라미터 중 40억 개의 활성 파라미터를 활용하는 혼합 전문가 구조를 갖췄다. 개발자들은 구글의 공식 개발자 페이지(ai.google.dev)를 통해 해당 모델의 상세 사양과 배포 구조를 확인할 수 있다.

보안 감사 현장에서는 클로드 오퍼스 4.8(Claude Opus 4.8)이 놓친 권한 설정 오류와 기술적 취약점을 페이블 5(Fable 5)가 추가로 발견하며 정밀한 탐지 능력을 입증했다. 그러나 페이블은 사용자가 의도하지 않은 방향으로 자율적인 행동을 수행하거나, 엄격한 안전 장치로 인해 답변을 거부하고 다른 모델 사용을 권고하는 등 과도한 제약으로 사용자들의 불만을 사고 있다. 특히 유료 플랜 내 페이블 5 제공 기간은 출시 후 약 12일인 6월 22일까지만 유효하므로, 이후에는 API를 통해 토큰 비용을 직접 지불해야 하는 실무적 제약이 따른다.

앤스로픽(Anthropic)이 에이전트 및 코딩 작업에 특화된

발표보다 숫자가 더 크게 말했다. 앤스로픽(Anthropic)은 에이전트 작업과 코딩, 과학적 지식 업무 전반에서 성능을 극대화한 신규 모델 Fable 5를 유료 플랜 사용자들에게 공식 배포했다. 이 모델은 사용자가 기존에 작성하던 스크립트의 후반부를 맡겼을 때 문체와 톤을 정확히 모방하는 수준의 작문 능력을 갖췄다. 기존 AI 모델들이 보이는 전형적인 문체를 탈피해 실무에서 즉시 활용 가능한 결과물을 생성한다는 점이 가장 큰 특징이다.

Diffusion Gemma(구글이 개발한 확산 모델 기반의 언어 모델)는 기존의 자기회귀 방식과 달리 고정된 윈도우 크기 내에서 모든 토큰을 병렬로 생성한다. 이 방식은 전체 답변을 초안 형태로 즉시 생성한 뒤 생성 과정에서 이전 단계의 오류를 수정하며 정교화하는 구조를 취한다. 또한 Transformers, vLLM, MLX, llama.cpp 등 주요 AI 프레임워크 및 라이브러리에서 출시 첫날부터 즉각적인 지원을 제공하여 개발 환경과의 호환성을 확보했다.

Siri AI는 메시지, 이메일, 사진, 캘린더, 연락처 등 기기 내 개인 데이터를 직접 검색하고 이해하여 개별적인 질문에 답변한다. 사용자는 이를 통해 메시지에서 식당 추천을 찾거나 이메일에서 호텔 예약 번호를 추출하는 복합적인 작업을 수행할 수 있다. 또한 Write with Siri(시스템 전반에서 텍스트 생성 및 편집을 지원하는 도구)를 통해 사용자의 평소 대화 스타일을 학습하고 특정 상대방에게 보내는 메시지 톤을 자동으로 조정하는 기능을 제공한다.

SpaceX는 우주 기반 AI 데이터 센터를 구축하기 위해 AI-1 위성을 개발 중이다. 스타십(Starship)에 실려 궤도에 진입할 이 위성은 우주 공간에서 데이터를 직접 처리하고 지구로 전송하는 역할을 수행한다. 각 위성은 150kW의 피크 전력과 120kW의 평균 전력을 제공하며 지구 밖에서 대규모 연산 자원을 운용하는 인프라로 기능한다.

애플이 WWDC 2026에서 기존 Siri를 재설계한

지난 15년간 타이머조차 제대로 설정하지 못해 사용자들에게 실망을 안겨주었던 음성 비서가 드디어 실무적인 자동화 도구로 탈바꿈했다. 애플은 WWDC 2026에서 기존 Siri를 완전히 재설계한 Siri AI를 공개하며, 단순한 음성 명령 수행 기기에서 개인 AI 비서로의 전환을 공식화했다. 이번 개편은 차세대 Apple Intelligence(애플의 기기 내 통합 AI 시스템)를 기반으로 작동하며, 사용자의 기기 내 정보를 깊이 있게 이해하고 통합하는 데 초점을 맞췄다. 이는 기술 자체의 과시보다는 사용자의 프라이버시와 유용성을 우선시하는 애플의 신중한 접근 방식을 보여준다.

Siri AI는 화면에 표시된 내용을 실시간으로 인식하고 상호작용하는 화면 인식(Screen awareness) 기능을 핵심으로 한다. 사용자가 맥에서 컨트롤 클릭을 하거나 아이패드에서 스크린샷을 찍으면, Siri AI는 현재 보고 있는 파일, 이미지, 웹 페이지, 앱, 텍스트를 분석하여 질문에 답하거나 즉각적인 작업을 수행한다. 예를 들어 웹사이트 개선 요청 시 Fable(웹사이트 코드 수정 및 디자인 개선을 지원하는 도구)을 활용하면 이미지 렌더링 문제를 해결하거나 디자인 스타일을 수정하는 등 실질적인 변화를 이끌어낸다. 다만 로고 오류나 간격 문제 등은 여전히 수정이 필요한 영역으로 남아 있다.

애플의 크레이그 페더리기는 일부 기업이 기술 자체를 위해 AI 개발을 서두르는 상황을 경계하며, 개인을 위한 실용적 비서로서의 가치를 강조했다. 반면 다른 모델인 Claude Fable 5(사이버 보안 및 생물학 분야 등에 안전 가드레일을 적용한 AI 모델)는 특정 프롬프트에 대해 성능이 낮은 하위 모델로 강제 전환하거나 답변을 거부하는 엄격한 안전 정책을 유지한다. Siri AI는 이러한 경쟁 모델들과 달리, 사용자의 개인 데이터를 기기 내부에서 직접 처리하며 실무적인 자동화 도구로서의 활용 가능성을 넓히는 데 집중한다.

투자금과 참여 투자자가 보여주는 신호

투자자가 기대하는 미래 가치는 단순히 기술의 진보를 넘어 천문학적인 자본의 흐름으로 증명된다. SpaceX는 750억 달러 규모의 자금 조달을 추진 중인데, 이는 2019년 사우디 아람코가 기록한 약 300억 달러의 IPO 기록을 3배가량 상회하는 수치다. 현재 시장 수요는 목표액의 4배인 2,500억 달러를 넘어섰으며, 이는 민간 우주 산업이 가진 실무적 확장성에 대한 강력한 신뢰를 나타낸다.

소프트웨어 엔지니어링 벤치마크(Software Engineering Bench Pro)에서 Fable 5는 80% 이상의 점수를 기록하며 기존 모델들을 압도했다. Claude Opus가 69%, GPT 5.5가 58%의 점수를 낸 것과 비교하면 비약적인 성능 향상이다. 다만 Claude Fable 5를 활용하는 비용은 Claude Opus 4.8의 두 배로 책정되었다. 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러라는 가격 구조는 고성능 모델을 실제 자동화 도구로 도입할 때 고려해야 할 실질적인 운영 비용 기준이 된다.

AI-1 위성은 GPU 모듈을 교체할 수 있는 핫스왑(Hot-swappable, 전원이 켜진 상태에서 부품을 교체하는 방식) 구조를 채택했다. 초기 테스트에는 NVIDIA의 Vera Rubin 플랫폼이 사용되지만, 향후 Google이나 Amazon의 칩으로도 교체할 수 있는 유연성을 갖췄다. 또한 Diffusion Gemma(구글의 오픈 모델)는 260억 개의 파라미터 중 40억 개의 활성 파라미터만 사용하는 전문가 혼합(MoE, 특정 작업에 최적화된 하위 모델을 선택적으로 사용하는 기술) 구조를 통해 효율성을 극대화했다. 각 토큰은 128개의 전문가 중 8개와 공유 전문가 1개로 라우팅되며, 30개의 슬라이딩 윈도우 어텐션 레이어를 통해 연산 효율을 높인다.

앤스로픽(Anthropic)이 새로운 모델 'Claude'로 시작

무료 서비스의 화려한 겉모습 뒤에는 항상 정교하게 설계된 비용 청구서가 숨어 있다. 6월 9일 앤스로픽은 기존 최상위 모델인 Opus보다 높은 성능을 갖춘 Claude Fable 5와 그 기반 모델인 Claude Mythos 5를 공개했다. Fable 5는 Mythos 등급의 모델로서 강력한 연산 능력을 자랑하지만, 안전 가드레일(AI의 유해한 출력을 제한하는 정책)을 강화한 버전이다. 사용자가 200달러 상당의 Claude Max 구독 플랜을 이용하더라도 30분 만에 일일 사용량을 모두 소진할 정도로 운영 비용이 높게 책정되었다. API 사용료 역시 기존 Claude Opus 4.8 대비 2배 수준으로 설정되어 실무적인 대규모 연산에는 상당한 비용 부담이 따른다.

모델의 성능만큼이나 가드레일 정책을 둘러싼 운영상의 잡음도 적지 않다. 출시 직후 보수적인 제한 조치에 대한 사용자들의 거센 반발이 이어지자 앤스로픽은 2시간 만에 일부 정책을 철회하는 결정을 내렸다. 향후 앤스로픽은 가드레일 적용 여부를 사용자에게 투명하게 공개하겠다는 방침을 세웠다. 현재 Pro, Max, Team 플랜 사용자는 Claude Fable 5를 이용할 수 있으나, 이 혜택은 6월 22일까지만 유효하다. 6월 23일부터는 기존 플랜에서 제외되어 별도의 사용 크레딧을 지불해야만 접근이 가능하다.

한편, 고성능 모델 구동을 위한 하드웨어 요구 사양은 실무 환경의 진입 장벽으로 작용한다. Diffusion Gemma(구글이 공개한 이미지 생성 모델)를 예로 들면, BF16 원본 가중치 사용 시 52GB의 VRAM이 필요해 A100이나 H100 같은 고사양 서버급 장비가 필수적이다. FP8 양자화(모델의 가중치 정밀도를 낮춰 메모리 사용량을 줄이는 기술)를 적용하면 27GB로 낮아지지만 여전히 A6000급 사양이 요구되며, NVFP4 양자화 시 18GB까지 VRAM 점유를 줄일 수 있다. 이와 별개로 시장의 자본 흐름은 우주 산업으로도 향하고 있다. SpaceX(민간 우주 탐사 기업)의 기업 가치는 최근 파이낸셜 타임즈와 블룸버그 보도에 따르면 주당 162달러 수준으로 추정되며, 전체 기업 가치는 2.1조 달러에 육박하는 것으로 평가받는다.

애플의 이번 개편은 단순한 음성 명령 인터페이스의 개선을 넘어, OS 내부 데이터를 직접 제어하는 에이전트 아키텍처로의 근본적인 전환을 의미한다. 이제 사용자는 Siri가 단순히 명령을 듣는 기계인지, 아니면 실무적 자동화를 수행하는 파트너인지 직접적인 워크플로우 테스트를 통해 판단해야 한다. 오늘 당장 특정 앱 내의 복합적인 데이터 처리 작업을 Siri에게 맡겨보며, 15년 만에 바뀐 이 엔진이 실제 업무 생산성을 얼마나 실질적으로 견인하는지 확인하기 바란다.