수작업으로 일일이 검증해야 했던 복잡한 코드 리팩토링, 여러 단계를 거쳐야 하는 에이전트 태스크, 그리고 고해상도 이미지 분석이 매일 아침 개발자에게 가장 부담스러운 작업이다. 이번 주 Anthropic이 공개한 Claude Opus 4.7은 이런 작업들을 사람이 직접 붙잡고 있지 않아도 믿고 맡길 수 있는 수준에 도달했다고 한다.

Opus 4.7의 핵심 변화: 코딩·비전·멀티스텝

Anthropic은 4월 16일 Claude Opus 4.7을 모든 Claude 제품과 API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 사용할 수 있게 공개했다. 가격은 Opus 4.6과 동일하게 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러다. API로는 `claude-opus-4-7` 식별자를 사용한다.

고급 소프트웨어 엔지니어링에서 Opus 4.7은 Opus 4.6 대비 두드러진 개선을 보였다. 특히 가장 어려운 작업에서의 성능 향상이 컸다. 초기 테스터들은 "이전에는 긴밀한 감독이 필요했던 가장 어려운 코딩 작업을 Opus 4.7에 자신 있게 넘길 수 있다"고 보고했다. 모델은 복잡하고 장기 실행되는 작업을 엄격하고 일관되게 처리하며, 지시사항을 정밀하게 따르고, 결과를 보고하기 전에 자체 출력을 검증하는 방식을 고안한다.

비전 능력도 크게 개선되었다. 더 높은 해상도로 이미지를 볼 수 있으며, 전문 작업(인터페이스, 슬라이드, 문서 작성)에서 더 세련되고 창의적인 결과물을 생성한다. 다만 가장 강력한 모델인 Claude Mythos Preview보다는 전반적 능력이 낮지만, Opus 4.6보다는 다양한 벤치마크에서 더 나은 결과를 보여준다.

보안과 안전성: Mythos Preview를 위한 실험장

지난주 발표된 Project Glasswing의 첫 번째 적용 모델이 Opus 4.7이다. Anthropic은 Claude Mythos Preview의 사이버보안 능력이 너무 강력하기 때문에, 먼저 덜 강력한 모델에서 새로운 사이버 안전장치를 테스트하겠다고 밝혔다. Opus 4.7은 Mythos Preview보다 사이버 능력이 낮으며, 훈련 과정에서 이러한 능력을 차별적으로 줄이기 위한 실험도 진행되었다.

금지되거나 고위험 사이버보안 사용을 나타내는 요청을 자동으로 감지하고 차단하는 안전장치가 Opus 4.7에 탑재되었다. 합법적인 사이버보안 목적(취약점 연구, 침투 테스트, 레드팀 운영)으로 Opus 4.7을 사용하려는 보안 전문가는 Anthropic의 새로운 Cyber Verification Program에 가입할 수 있다.

안전성 평가에서 Opus 4.7은 Opus 4.6과 유사한 프로필을 보였다. 기만, 아첨, 오용 협력 같은 우려 행동의 비율이 낮았다. 정직성과 악의적 프롬프트 인젝션 저항력에서는 Opus 4.6보다 개선되었으나, 통제 물질에 대한 과도히 상세한 피해 감소 조언을 제공하는 경향은 다소 약화되었다. 정렬 평가 결과는 "대체로 잘 정렬되고 신뢰할 수 있지만, 행동이 완전히 이상적이지는 않다"는 결론을 내렸다.

개발자가 알아야 할 토큰 사용 변화

Opus 4.7은 Opus 4.6의 직접 업그레이드이지만, 토큰 사용량에 영향을 주는 두 가지 변화가 있다. 첫째, 업데이트된 토크나이저를 사용한다. 동일한 입력이 콘텐츠 유형에 따라 약 1.0~1.35배 더 많은 토큰으로 매핑될 수 있다. 둘째, 높은 노력 수준에서 더 많이 "생각"한다. 이는 어려운 문제에 대한 신뢰성을 높이지만, 더 많은 출력 토큰을 생성한다.

개발자는 `effort` 파라미터를 사용하거나, 태스크 예산을 조정하거나, 모델에 더 간결하게 응답하도록 프롬프팅하여 토큰 사용을 제어할 수 있다. Anthropic은 자체 테스트에서 모든 노력 수준에서 토큰 사용 효율이 개선되었다고 밝혔지만, 실제 트래픽에서 차이를 측정할 것을 권장한다. 마이그레이션 가이드도 제공된다.

이미지 처리 방식에서 개발자가 바로 체감하는 변화가 있다. 이는 API 파라미터가 아닌 모델 수준 변경이므로, 사용자가 Claude에 보내는 이미지는 자동으로 더 높은 해상도로 처리된다. 고해상도 이미지는 더 많은 토큰을 소비하므로, 추가 디테일이 필요 없는 사용자는 이미지를 모델에 보내기 전에 다운샘플링할 수 있다.

Claude Design: 새로운 시각 작업 도구

Opus 4.7 출시와 함께 Anthropic은 Claude Design이라는 새로운 Anthropic Labs 제품도 공개했다. 이 도구는 Claude와 협력하여 디자인, 프로토타입, 슬라이드, 원페이지 문서 등 시각적 작업물을 제작할 수 있게 해준다.

초기 테스터 피드백은 전반적으로 긍정적이다. 한 테스터는 "Opus 4.7은 내가 가장 어려운 코딩 문제를 넘겨줄 수 있는 첫 번째 모델"이라고 평가했고, 다른 테스터는 "이미지 이해 능력이 극적으로 향상되어 복잡한 다이어그램과 UI 목업을 훨씬 잘 분석한다"고 전했다.

Opus 4.7 시스템 카드에서 전체 평가 결과를 확인할 수 있다.