한 창업자가 어제까지 공들여 만든 핵심 기능을 삭제한다. OpenAI가 새로운 모델을 출시했다는 소식을 들은 지 불과 몇 시간 만이다. 2년짜리 로드맵을 지키는 대신, 모델의 변화에 맞춰 제품의 방향을 즉시 튼다. 계획의 완결성보다 모델의 진화 속도에 몸을 맡기는 장면이 AI 스타트업 씬에서 일상이 됐다.

확률적 엔지니어링과 70%의 실험

Modular(AI 모델 최적화 및 배포 플랫폼)의 공동창업자 Tim Davis는 에세이 Probabilistic Engineering and the 24-7 Employee를 통해 소프트웨어 패러다임의 전환을 선언했다. AI 네이티브 팀의 엔지니어 업무 비중은 실험 70%, 로드맵 30%로 역전되었다. 코드의 상당 부분이 확률적 모델에 의해 생성되고 인간이 빠르게 리뷰하며 통합하는 구조다. 이제 개발자는 코드가 완벽히 작동한다는 확신 대신, 작동할 것이라는 신뢰 구간(Confidence Interval, 결과값이 특정 범위 내에 있을 확률을 나타내는 수치)을 가지고 제품을 출시한다.

생성 비용은 낮아졌으나 검증 비용은 여전히 높다. 코드베이스가 작동한다고 아는 상태에서 작동한다고 믿는 상태로 전환되었다. 시니어 엔지니어들이 일부 경험하던 불확실성이 이제는 전체 시스템의 기본값이 됐다. 단일 인간이 전체 설계를 장악하지 않은 채 AI가 짠 코드가 얽히고설킨 지형이 형성되었다.

결정론적 로드맵의 붕괴와 에이전트 기본 자세

예전에는 입력값이 같으면 출력값이 항상 동일한 결정론적 시스템이 표준이었다. 투자자들은 분기별 로드맵을 정교하게 실행하는 구조화된 창업자를 선호했다. 시드 단계의 핵심 평가 기준은 비전의 명확성이었다. 이제는 로드맵을 약속이 아닌 가설로 취급하는 확률적 창업자가 전면에 나선다. 장기 비전은 유지하되 2~3개월 내에 모든 계획이 바뀔 수 있음을 당연하게 수용한다.

개발자가 체감하는 가장 큰 변화는 에이전트(특정 목표를 위해 자율적으로 판단하고 행동하는 AI)를 대하는 태도다. 확률적 창업자는 모든 작업을 에이전트 중심으로 수행 가능하다고 가정하는 에이전트 기본 자세를 취한다. 에이전트가 작동하지 않을 때 과거에는 도구의 성능 부족으로 결론지었다. 이제는 자신의 명세(Specification, 시스템 요구사항 정의서)와 오케스트레이션(Orchestration, 여러 AI 모델과 도구를 효율적으로 연결하고 조율하는 과정) 능력이 부족했다고 판단한다. 책임의 소재를 도구가 아닌 운영자의 설계 능력으로 옮긴 포석이다.

투자자들이 창업자를 평가하는 잣대도 이동하고 있다. 5년 전이라면 비체계적이거나 엄밀함이 부족하다고 평가받았을 신호들이 이제는 생존을 위한 필수 역량으로 읽힌다. 모델 출시 다음 날 기능을 폐기하는 과감함과 불확실성 속에서 동요하지 않는 능력이 핵심이다. 엄밀함의 기준이 로드맵 준수에서 실험의 품질과 선별 규율로 옮겨갔다. 에이전트 함대를 올바른 문제에 배치하고, 그럴듯하지만 틀린 결과물을 구별해내는 능력이 새로운 경쟁 우위가 됐다.

인재를 끌어들이는 방식 역시 변했다. 소수 정예 팀과 에이전트 함대가 50명 규모의 팀을 능가하는 시대가 왔다. 상위 1% 운영자를 확보하는 프리미엄은 더욱 높아졌다. 확률적 창업자는 가차 없는 실행력을 갖춘 인재들이 커리어를 재배치해서라도 함께 일하고 싶어 하는 유형이다. 실행 없는 실험은 소음에 불과하며, 인재 없는 속도는 이탈로 이어진다는 사실은 변하지 않았다.

AI 시대의 승부는 정교한 계획서가 아니라 불확실성을 견디며 실험의 밀도를 높이는 운영자의 감각에서 결정된다.