자신만만한 거짓말의 한계

가짜 판례를 당당하게 인용하거나, 세상에 없는 API 라이브러리를 추천하는 AI를 경험해 본 적 있으실 겁니다. 이런 환각(Hallucination) 현상은 단순한 버그가 아니라, LLM이 다음 토큰을 예측하는 방식에서 오는 구조적 결과물이죠. 하지만 기업 입장에서 '자신만만한 거짓말'은 '모른다는 솔직한 고백'보다 훨씬 위험합니다.

앤스로픽(Anthropic)은 이 지점을 파고들었습니다. 정직함을 단순한 윤리적 가치가 아니라 핵심 제품 기능으로 정의한 겁니다. 앤스로픽은 AI 모델이 성급하게 결론을 내리는 고질적인 문제를 인정하며, 단순히 지능을 높이는 것보다 "근거 없는 주장을 하지 않는 정직한 모델"을 만드는 데 집중하고 있습니다.

이런 철학이 집약된 결과물이 바로 클로드 오퍼스(Claude Opus) 4.8입니다. 이번 모델은 신뢰성을 최우선으로 설계됐는데요. 모르는 것을 모른다고 인정하는 능력을 한계가 아닌, 고부가가치 역량으로 취급하기 시작한 전환점이라 볼 수 있습니다.

정밀함의 비용 구조

물론 신뢰도를 높이는 데는 비용이 따릅니다. 클로드 오퍼스 4.8은 사용자가 지연 시간(Latency)과 비용 사이에서 선택할 수 있도록 듀얼 모드 요금제를 도입했습니다. 추론의 강도와 결과물의 긴급도에 따라 가격을 차등 적용한 셈이죠.

일반적인 작업에 쓰이는 '제너럴(General) 모드'는 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러입니다. 이전 버전인 오퍼스 4.7과 비슷한 수준이라, 시간이 크게 촉박하지 않은 대규모 텍스트 처리 작업에 적합합니다.

반면 속도가 생명인 상황에서는 '패스트(Fast) 모드'를 씁니다. 비용은 두 배로 뛰어 입력 10만 달러, 출력 50달러를 내야 하죠. 첫 토큰이 출력되기까지의 시간을 줄이면서도 고도의 추론 정밀도를 유지하기 위해 투입되는 계산 자원 비용이 반영된 결과입니다.

단일 플래그십 시대의 종말

오퍼스 4.8의 출시는 공식적이었지만, 전체 로드맵의 세부 내용은 조금 다른 경로로 알려졌습니다. 2026년 3월 31일, 클로드 코드(Claude Code)의 소스 코드가 유출되면서 내부 명칭들이 드러났고, 이후 구글 버텍스 AI(Google Vertex AI) 백엔드에서도 관련 식별자가 발견됐거든요.

유출된 내용을 보면 앤스로픽은 모든 것을 다 잘하는 단일 플래그십 전략을 버리고 있습니다. 중간 단계 모델인 클로드 소네트(Claude Sonnet) 4.8과 사이버 보안 특화 모델인 미토스 1(Mythos 1)을 배치해, 전문 영역별로 최적화된 계층형 라인업을 구축하고 있습니다.

범용 지능의 성능 향상이 임계점에 도달했다는 분석도 있고, 작업 성격에 따라 최적화 목표가 완전히 달라야 한다는 판단일 수도 있습니다. 모델을 다각화함으로써 어떤 모델은 시각적 정밀도를, 어떤 모델은 보안의 엄격함을 극대화하는 전략이죠.

상황별 모델 선택 가이드

이렇게 라인업이 세분화되면서 기업들은 작업의 리스크 프로필에 따라 모델을 골라 쓰는 의사결정 매트릭스를 갖게 됐습니다. 무조건 가장 큰 모델을 쓰는 게 아니라, 목적에 맞는 도구를 선택하는 식입니다.

당신이 근거 없는 주장이 법적 책임으로 이어질 수 있는 전문 보고서를 작성 중이라면, **오퍼스 4.8**이 정답입니다. 강화된 정직함 덕분에 출력값이 검증 가능한 사실에 기반하기 때문이죠. 비용 효율성이 중요한 대량 텍스트 처리라면 오퍼스 4.8의 제너럴 모드가 가장 안정적인 선택지가 됩니다.

UI 디자인 시안이나 복잡한 아키텍처 다이어그램을 분석해야 한다면 **소네트 4.8**을 추천합니다. 시각적 정확도를 98%까지 끌어올려 오퍼스 4.7(98.5%)에 근접한 성능을 내거든요. 반면 고도의 신뢰가 필요한 보안 워크플로우나 딥 사이버 보안 분석이 목적이라면 특화 모델인 **미토스 1**이 적절합니다.

전문화의 역설, 카피바라

하지만 전문화에는 함정이 있습니다. 내부적으로 '카피바라(Capybara)'라 불리는 미토스 1의 유출 데이터에서 흥미로운 흐름이 발견됐는데요. 보안 분야에 최적화될수록 오히려 일반적인 정직함은 떨어지는 경향을 보였습니다.

데이터에 따르면 카피바라 v4의 허위 주장 비율은 16.7%였습니다. 그런데 모델이 v8에 이르자 이 비율이 29~30%까지 치솟았습니다. 특정 도메인의 성능을 올리기 위해 튜닝하는 과정에서, 모델이 정직하게 답변하는 기본 능력이 퇴보하는 '회귀 현상'이 나타난 겁니다.

결국 특정 분야의 극단적인 전문성을 추구할 때, 앤스로픽이 플래그십 모델에서 강조했던 '정직함'을 유지하는 것이 얼마나 어려운 과제인지를 보여주는 대목입니다.

이제는 '신뢰 계층' 전쟁이다

2026년 6월을 향해 가면서 경쟁 구도가 바뀌고 있습니다. 오픈AI(OpenAI)의 GPT-5.6과 구글(Google)의 제미나이(Gemini) 3.5 프로의 등장이 예고된 지금, 업계는 단순한 벤치마크 점수 경쟁 시대를 지나고 있습니다. 실제로 오퍼스 4.8은 이미 GPT-5.5나 제미나이 3.1 프로의 합성 벤치마크 점수를 상회한다는 분석도 나오죠.

이제 진짜 승부처는 '신뢰 계층(Trust Layer)'입니다. 시장의 승자는 가장 IQ가 높은 모델이 아니라, 예측 가능성을 높여 기업의 리스크를 최소화하는 모델이 될 가능성이 큽니다. CEO에게는 약간 더 똑똑하지만 어디로 튈지 모르는 모델보다, 침묵해야 할 때를 아는 모델이 훨씬 가치 있기 때문입니다.

결국 비즈니스 관점에서 어떤 모델을 도입해야 할까요? 절대적인 사실 관계의 신뢰도와 리스크 관리가 우선이라면 오퍼스 4.8이 현재의 골드 표준입니다. 전문적인 보안 분석이 필요하다면 미토스 1을 쓰되, 허위 주장 가능성이 높다는 점을 감안해 검수 프로세스를 갖춰야 합니다. 이제 선택의 기준은 '성능'이 아니라 '어떤 종류의 신뢰가 필요한가'로 옮겨갔습니다.