발표에서 확인된 핵심 사실

사용자는 그동안 브라우저의 기능을 확장하려면 외부 개발자가 배포한 플러그인을 찾아 설치하고 복잡한 설정을 변경해야 했다. 이제 Safari는 텍스트 프롬프트만으로 웹 페이지를 수정하는 커스텀 확장 프로그램을 직접 생성한다. 탭을 주제별로 자동 그룹화하고 기존 그룹에 관련 탭을 제안해 추가하는 AI 기반 관리 기능이 추가된다. 특히 가격이나 뉴스 같이 시간에 민감한 정보의 변경 사항을 실시간으로 감지해 알림을 보내는 페이지 모니터 기능이 함께 도입된다. 개발자가 미리 정의한 코드의 범위 내에서 움직이는 것이 아니라 사용자의 요구사항이 곧바로 브라우저의 동작을 정의하는 실시간 제어권으로 전환된다.

기본 앱들이 각각 독립적으로 작동하던 기존의 조작 경험도 AI 편의 기능으로 통합된다. 유출된 비밀번호를 발견하면 한 번의 탭으로 즉시 업데이트하며, Calendar에서는 인물과 시간만 언급하는 자연어 입력만으로 이벤트를 생성한다. 사용자가 인물과 시간만 지정하면 Apple Intelligence가 나머지 세부 사항을 처리해 일정을 완성하는 방식이다. Messages는 텍스트 설명으로 사진을 검색하는 기능과 AI 기반의 답장 제안 기능을 갖춘다. 사용자가 앱의 메뉴를 일일이 찾아 들어가는 수동적 조작 대신 자연어로 의도를 전달하면 OS가 적절한 앱의 기능을 호출해 처리한다. 개별 앱의 단편적인 기능을 넘어 OS가 사용자 데이터를 어떻게 엮어내는지에 대한 실무적 구현 기준이 적용된다.

기술이 실제로 작동하는 방식

개별 앱은 서로 격리된 섬처럼 작동한다는 것이 당연한 상식이었다. 이제는 통화 중인 상태에서 Mail(메일)이나 Messages(메시지) 같은 타 앱에 흩어져 있는 컨텍스트 정보를 실시간으로 호출해 화면에 띄운다. 항공사 고객센터와 통화하는 도중 이메일 수신함에 저장된 항공편의 구체적인 세부 정보를 즉시 확인해 상담원에게 전달하는 동작이 가능하다. 이 기능은 사용자가 정보를 찾기 위해 앱을 직접 전환하며 화면을 오가는 번거로움을 제거한다. 이는 Google(구글)이 선보인 Magic Cue(매직 큐) 기능에 직접적으로 대응하는 전략이며, OS 수준에서 사용자의 개인 데이터를 실시간으로 엮어내는 AI 경쟁이 실제 기능으로 구현됐다.

사진 편집은 이미 찍힌 프레임 안에서 색감이나 밝기를 조정하는 단순 보정 작업에 머물렀다. Photos(포토) 앱에 도입되는 AI 기반 확장 도구는 사진의 외곽 가장자리를 AI가 분석해 자연스럽게 확장하며 빈 배경을 생성한다. 더 나아가 기기 내부에서 작동하는 온디바이스 공간 모델과 이미지 생성 모델을 결합한 Spatial Reframing(스페이셜 리프레이밍) 기능은 프레임 내에 배치된 피사체나 특정 객체의 위치를 사용자가 원하는 지점으로 재배치한다. 새로운 시점을 설득력 있게 채워 넣는 이 방식은 최근 촬영한 사진은 물론 라이브러리에 저장된 오래된 사진에도 동일하게 적용한다. 2차원 이미지를 공간 데이터로 재해석해 구도를 다시 잡는 실무적 제어권이 확보됐다.

고해상도 사실적 이미지 생성 모델과 자연어 기반의 정밀 편집

생성형 AI로 이미지를 만들 때 원하는 부분만 정확히 수정하지 못해 답답했던 적이 있는가. Image Playground(이미지 생성 도구)는 고해상도 사실적 이미지 생성 모델과 자연어 기반의 정밀 편집 기능을 업데이트한다. 사용자는 탭, 원 그리기, 브러시를 이용해 이미지 내 개별 객체를 정밀하게 선택해 편집하며, 생성된 이미지의 규격을 다양한 포맷에 맞게 조정한다. Apple은 새로운 API(응용 프로그램 인터페이스)를 통해 이 이미지 생성 기능을 제3자 개발자에게 개방한다. 외부 개발자가 이 API를 활용하면 개별 앱 내에서도 고해상도 이미지 생성과 정밀 편집 기능을 즉시 구현하며 사용자 경험을 확장한다.

복잡한 자동화 설정을 위해 수십 개의 단계를 일일이 연결하는 작업은 번거롭다. Shortcuts(단축어) 앱은 자연어 설명을 통해 워크플로우를 자동으로 구축하는 AI 생성 기능을 도입한다. 사용자가 단계별로 수동 설정을 하는 대신, 원하는 내용을 일상 언어로 설명하면 앱이 자동으로 단축어를 생성한다. 이는 전문적인 코딩 지식 없이 의도만으로 기능을 구현하는 vibe-coding(의도 중심 코딩) 방식을 일반 아이폰 사용자에게 확장한 결과다. 사용자는 이제 개별 앱의 기능을 넘어 OS가 데이터를 어떻게 엮어내는지에 대한 실무적 구현 기준을 자연어 인터페이스를 통해 확인한다.

아이폰 기본 앱들이 독립적인 섬으로 작동하던 사용자 경험은 이제 사라진다. 텍스트 프롬프트만으로 사파리 커스텀 확장 프로그램을 생성하고, 온디바이스 공간 모델과 이미지 생성 모델을 결합해 피사체의 위치를 바꾸는 스페이셜 리프레이밍이 이를 증명한다. 이제 개발의 초점은 개별 앱의 기능 고도화가 아니라, OS가 데이터를 어떻게 엮어내어 사용자에게 전달하는지에 대한 통합 구현 기준으로 이동한다.