인공지능 모델이 복잡한 과제를 처리하는 방식이 급변하고 있습니다. 제미나이 3.5 플래시가 업계 성능 지표에서 1위를 차지하며 더 빠르고 효율적인 고성능 모델 경쟁을 예고했습니다. 인재 영입도 활발합니다. 안드레 카파시가 앤스로픽에 합류하며 클로드 시리즈의 기술적 역량 강화에 힘을 보탰습니다.

이제 AI는 단순히 대화하는 수준을 넘어, 스스로 판단하고 과제를 수행하는 ‘자율 행동형(agentic)’ 업무 흐름이 핵심입니다. 구글 검색은 생성형 AI를 결합해 복잡한 다단계 요청을 직접 해결하고 있으며, 클로드 코드는 전문 기술을 더해 실무 능력을 확장 중입니다. 개발 환경에서도 변화가 뚜렷합니다. 랭스미스(LangSmith)는 이러한 자율형 AI를 최적화하는 새로운 방안을 내놓았고, 코덱스(Codex)는 모델이 한 번에 처리할 수 있는 정보량인 ‘문맥 창(context window)’의 한계에 직면했습니다.

거대 기업들의 움직임 외에도 주목할 기술적 진전이 많습니다. 큐엔(Qwen) 3 6B는 추론 능력을 대폭 끌어올렸고, AI가 코딩 과정에서 중요한 코드를 실수로 덮어쓰지 않도록 막는 ‘정지 후크(stop hooks)’ 기능도 등장했습니다. 제미나이는 웨어러블 기기 브랜드와의 협업을 통해 접점을 넓히고 있으며, AI가 외부 데이터를 다루는 방식을 세밀하게 조정하는 ‘문맥 계층(context layers)’ 기술도 도입되고 있습니다.

핵심 인재의 이동부터 토큰 처리라는 기술적 제약까지, 지금 AI 업계는 모델의 야심 찬 목표와 현실적인 기술적 한계 사이에서 치열한 줄다리기를 이어가고 있습니다.

01구글 제미나이 3.5 Flash, 속도와 성능 두 마리 토끼 잡았다

구글이 고성능 AI를 저렴하고 빠르게 실행할 수 있는 새 모델 '제미나이 3.5 Flash'를 공개했다. 대규모 AI 작업을 처리해야 하는 기업이나 개발자 입장에서는 가장 강력한 모델을 쓸 때 겪던 속도 저하나 비용 부담 없이 복잡한 요청을 해결할 수 있게 된 셈이다. 구글의 AI 처리량은 현재 매달 3.2경 토큰(AI가 읽고 쓰는 텍스트의 기본 단위)에 달하며, 이는 지난해보다 7배나 늘어난 수치다. 불과 2년 전만 해도 이 수치는 9.7조 토큰에 불과했다는 점을 고려하면, 전 세계적으로 AI를 활용한 문제 해결 방식이 얼마나 폭발적으로 성장했는지 알 수 있다.

제미나이 3.5 Flash는 단순히 효율성만 높인 것이 아니라, 추론과 코딩 능력에서도 이전 모델을 뛰어넘는 성능을 보여준다. 코딩 성능 평가인 'Terminal Bench 2.1'에서 제미나이 3.5 Flash는 76.2%를 기록하며, 70.3%에 그친 기존 '제미나이 3.1 Pro'를 앞질렀다. 추론 능력 역시 'GDP Val AA' 성능 시험에서 1,656점을 기록해 1,314점에 머문 Pro 모델을 크게 따돌렸다. 모델의 종합적인 능력을 측정하는 'MCP Atlas' 테스트에서도 83.6%의 점수를 받아 3.1 Pro의 78.2%를 상회했다. 'Flash'라는 이름이 붙었다고 해서 지능을 희생한 것은 아니라는 점이 수치로 증명된 것이다.

이번 모델의 가장 강력한 경쟁 우위는 단연 압도적인 출력 속도다. 제미나이 3.5 Flash는 초당 약 280토큰을 생성하는데, 이는 경쟁 모델들을 압도하는 수준이다. 비교하자면 GPT 5.5와 클로드 Opus 4.7의 평균 속도는 초당 60~70토큰에 불과해, 구글의 새 모델이 약 4배가량 더 빠르다. 이러한 성능 향상은 즉각적인 반응이 필수적인 서비스에서 사용자 경험을 완전히 바꿀 수 있다. 구글은 최고 수준의 지능을 이 정도 속도로 구현함으로써 AI 도입의 걸림돌을 제거했고, 수백만 명의 사용자가 동시에 접속하는 환경에서도 정교한 추론 기능을 원활하게 제공할 수 있는 기반을 마련했다.

02코덱스, 기억 용량 한계에 부딪히다

코덱스(Codex)를 사용하는 개발자들은 시스템에 기능을 추가할수록 AI 도구가 갑자기 작동을 멈추는 현상을 겪곤 합니다. 이는 AI가 한 번에 처리할 수 있는 정보량인 '문맥 창(context window)'에 엄격한 제한이 있기 때문입니다. AI에게 작업을 수행하는 방법을 알려주는 '기술 설명서'가 이 한계를 넘어서면, 코덱스는 내용을 잘라내거나 아예 무시해 버립니다. 가장 큰 위험은 AI가 작업을 시작해야 할 특정 조건이나 키워드인 '트리거(triggers)'를 놓치는 것입니다. 특히 이 조건들이 설명서 뒷부분에 적혀 있을 때 이런 오류가 빈번하게 발생합니다.

이러한 제약은 AI 서비스 제공업체 간의 기술적 간극을 여실히 보여줍니다. 코덱스와 클로드 코드(Claude Code)는 모두 다양한 기술을 처리할 수 있지만, 이를 설계하고 실행하는 방식은 판이하게 다릅니다. 이 때문에 한 환경에서 완벽하게 작동하던 기능이 다른 곳에서는 먹통이 되기 일쑤고, 개발자들은 매번 지침을 다시 쓰고 수정해야 하는 번거로움을 겪습니다. 최근에는 이런 마찰을 줄이기 위해 서로 다른 AI 환경을 연결하는 '범용 어댑터' 도구들이 등장하고 있습니다. 예를 들어 '폴리 스킬(poly skill)' 명령어를 사용하면, AI가 실제로 작동하는 소프트웨어 환경인 '런타임(runtimes)'에 맞춰 기능을 자동으로 변환하고 재포장할 수 있습니다.

개발자는 `/poly skill convert [skill name] to Codex`와 같은 명령어를 입력하는 것만으로 기능을 코덱스 환경에 맞게 즉시 재구성할 수 있습니다. 이 과정은 기능을 관련 자산과 함께 특정 폴더에 넣고 'poly skill install' 명령을 실행해 배포하는 방식으로 진행됩니다. 이러한 자동화 방식은 개발자가 매번 지침을 새로 작성할 필요 없이 여러 AI 도구의 장점을 활용할 수 있게 돕습니다. 현재 고성능 자동화 시스템의 발목을 잡고 있는 메모리 제한과 설계 불일치를 해결할 실질적인 대안이 되고 있습니다.

03AI가 스스로 업무 규칙을 고친다 — 멈춤 신호를 활용한 자동 업데이트

AI 코딩 보조 도구들이 소프트웨어를 작성하는 과정에서 자신의 업무 지침서를 스스로 수정하며 오류를 바로잡고 있습니다. 이는 '멈춤 신호(stop hooks)'라는 기술 덕분입니다. 주력 AI가 작업을 마칠 때마다 보이지 않는 별도의 AI 세션이 즉시 실행되는 방식입니다. 이 보조 세션은 최근 변경된 코드 내용을 검토한 뒤, 'claude.md'와 같은 전역 규칙 파일에 반영할 수정 사항을 제안합니다. 시스템은 코드의 변화에 맞춰 규칙을 실시간으로 진화시킴으로써, AI가 프로젝트의 현재 상태와 맞지 않는 낡은 지침을 따르는 일을 방지합니다.

AI 에이전트는 규칙 업데이트를 넘어, 숙련된 개발자처럼 방대한 소프트웨어 프로젝트를 정밀하게 탐색하는 능력까지 갖추고 있습니다. '모델 컨텍스트 프로토콜(MCP) 서버'라는 특수 연결 장치를 활용하면, 단순한 텍스트 검색을 뛰어넘는 고도화된 탐색 도구에 접근할 수 있습니다. 특히 '언어 서버 프로토콜(LSP) 서버'를 도입하면, AI는 단순한 문자열 검색이 아니라 코드의 구조적 뼈대인 '심볼(symbols)'을 찾아낼 수 있습니다. 이는 수십만 줄에 달하는 코드 저장소를 관리할 때 필수적인 기능으로, 단순 검색 시 쏟아지는 수많은 불필요한 결과물을 걸러줍니다.

효율성을 극대화하기 위해 이러한 시스템은 탐색 단계와 실제 편집 단계를 분리하는 하위 에이전트 구조를 사용합니다. 에이전트가 웹 검색이나 대규모 코드 분석을 수행해야 할 때, 하위 에이전트에게 복잡한 작업을 맡기는 식입니다. 하위 에이전트는 핵심 요약본만을 주력 세션에 전달하며, 덕분에 AI의 단기 기억 공간인 '컨텍스트 윈도우(context window)'가 불필요한 데이터로 차오르는 현상을 막습니다. 이러한 기반 시설 구축은 복잡한 과정이기에, 기업들은 'AI 계층(AI layer)'을 전담할 소규모 팀을 꾸려 자동화가 확장될 수 있는 기초 규칙과 서버 환경을 마련해야 합니다.

04랭스미스, AI 성능 개선의 핵심은 모델 수정 아닌 '운영 최적화'

AI 에이전트의 성능은 모델 자체를 바꾸는 것보다, 모델을 어떻게 다루느냐에 따라 결정된다. 랭스미스(LangSmith)는 에이전트의 모든 행동 기록인 '추적(traces)'과 성능 시험인 '평가(evaluations)'를 통해 이를 구현한다. 이 도구들은 개발자에게 어디를 고쳐야 할지 정확히 알려주는 '학습 가이드(training gradient)' 역할을 한다. 개발자는 모델을 다시 훈련시키는 대신, 모델과 외부 환경을 잇는 '검증 장치(harness)'나 에이전트에게 주어지는 지시사항과 기술 같은 '맥락(context)'을 최적화한다. 랭체인(LangChain)은 이 방식을 통해 터미널 벤치 2(terminal bench 2) 순위를 30위권에서 5위권으로 끌어올렸다. 이러한 지속적인 학습 연구를 위해 랭체인은 최근 연구 조직인 랭체인 랩스(LangChain Labs)를 신설했다.

이러한 최적화 과정은 이제 랭스미스 플릿(LangSmith Fleet)을 통해 기술자가 아닌 일반 직원에게도 열렸다. 랭스미스 플릿은 자연어만으로 실무형 에이전트를 만들 수 있는 관리형 빌더다. 코딩 없이도 업무 흐름을 가장 잘 아는 실무자가 직접 필요한 도구를 만들 수 있게 된 것이다. 랭체인은 이미 사내에 인재 채용을 위한 소싱 에이전트, 마케팅용 인텔 봇(Intel bot), 엔지니어링 분류를 돕는 오픈스위트(OpenSuite) 등 여러 에이전트를 도입해 사용 중이다. 에이전트의 실용성을 높이기 위해 플릿은 200개 이상의 내장 도구와 아케이드(Arcade)와의 제휴로 확보한 7,500개의 추가 도구, 그리고 기업 내부 데이터와 연결할 수 있는 모델 맥락 프로토콜(Model Context Protocol)을 지원한다.

이러한 접근 방식은 실제 비즈니스 성과로 나타나고 있다. 플릿으로 구현한 한 시장 진출(go-to-market) 에이전트는 고객 발굴부터 자격 검증까지의 전환율을 240% 높였고, 고객 조사와 이메일 초안 작성을 자동화해 영업 담당자의 업무 시간을 월평균 40시간 절감했다. 오류를 방지하기 위해 시스템은 '인간 개입 검증(human-in-the-loop verification)'을 핵심 기능으로 탑재했다. 에이전트가 고객에게 보낼 개인화된 이메일 같은 작업을 수행하기 전, 잠시 멈추고 인간에게 검토나 수정을 요청하도록 설계된 것이다. 자동화된 최적화와 인간의 감독이 균형을 이루면서, 기업은 효율적이면서도 신뢰할 수 있는 고성능 에이전트를 현장에 배치할 수 있게 됐다.

05구글 검색이 바뀐다 — 질문하면 링크 대신 맞춤형 앱을 만든다

구글 검색이 단순히 정보를 나열하던 방식에서 벗어나, 사용자를 위해 직접 도구를 만들고 데이터를 관리하는 능동형 시스템으로 진화한다. 이번 변화의 핵심은 생성형 코딩 기술과 개인화된 정보 에이전트의 도입이다. 이제 검색 엔진은 외부 웹사이트로 연결해 주는 통로를 넘어, 사용자의 질문에 맞춰 실시간으로 전용 인터페이스를 구축하는 능동적인 비서 역할을 수행한다. 정보와 상호작용하는 방식 자체가 근본적으로 달라지는 것이다.

이를 구현하기 위해 구글은 제미나이(Gemini) 3.5 Flash 기반의 생성형 코딩과 '안티 그래비티(anti-gravity)'라 불리는 기술을 결합했다. 이 도구들은 검색 엔진이 실시간으로 역동적인 화면 구성과 대화형 시각 자료를 생성하도록 돕는다. 사용자 입장에서는 복잡한 질문을 던졌을 때 단순히 링크 목록이 나열되는 대신, 질문의 의도에 최적화된 직관적인 시각 인터페이스를 마주하게 된다. 검색 엔진이 사용자의 질문을 해결하는 데 가장 적합한 형태의 코드를 스스로 작성해, 검색할 때마다 일종의 맞춤형 애플리케이션을 즉석에서 만들어내는 셈이다.

시각적인 변화와 더불어 구글은 백그라운드에서 상시 작동하는 개인화 정보 에이전트를 선보인다. 이 에이전트들은 24시간 내내 필요한 정보를 능동적으로 탐색하다가, 사용자가 행동을 취해야 할 결정적인 순간에 알림을 보낸다. 이는 사용자가 일일이 질문을 던져야 했던 기존의 수동적인 검색 모델을, AI가 사용자의 배경 정보를 바탕으로 필요한 것을 미리 예측해 제안하는 능동형 모델로 탈바꿈시킨다. 해당 기능은 올여름부터 순차적으로 배포될 예정이며, 구글 AI Pro 및 Ultra 구독자에게 우선 제공된다.

06제미나이, 안경 브랜드와 손잡고 일상 속으로 들어간다

구글은 인공지능 비서와의 소통 방식을 스마트폰 화면 너머, 사용자의 시선이 닿는 곳으로 확장합니다. 젠틀몬스터(Gentle Monster), 와비파커(Warby Parker)와 같은 유명 안경 브랜드와 전략적 제휴를 맺고, 제미나이(Gemini)의 AI 기능을 웨어러블 기기에 직접 탑재하기로 했습니다. 이번 협업으로 안경은 단순한 패션 소품을 넘어, 스마트폰을 일일이 확인하지 않고도 디지털 업무를 처리하는 실용적인 도구로 변모합니다. 구글은 AI를 안경 테에 심어, 디지털 비서가 물리적 환경의 일부처럼 자연스럽게 녹아들게 만들겠다는 구상입니다.

올가을 출시될 이 웨어러블 기기들은 음성 명령을 통한 ‘핸즈프리’ 활용에 집중합니다. 사용자는 현재 눈앞에 보이는 사물이나 풍경에 대해 제미나이에게 질문할 수 있으며, AI는 실시간으로 주변 상황을 파악해 정보를 제공합니다. 활용 범위는 넓습니다. 길을 걸을 때 자연스러운 음성으로 실시간 경로 안내를 받거나, 기기를 만지지 않고도 전화를 걸고 문자를 보낼 수 있습니다. 통신 기능 외에도 음성만으로 사진과 영상을 촬영하고 즐겨 쓰는 앱을 실행할 수 있습니다. 특히 실시간 통역 기능이 추가되어, 대면 대화 중 발생하는 언어 장벽을 허물 것으로 기대됩니다.

초기 모델은 음성 기반의 상호작용에 집중하지만, 구글은 이미 더 시각적인 미래를 준비하고 있습니다. 구글은 사용자의 시야에 정보를 직접 띄워주는 디스플레이 안경을 추후 선보일 계획입니다. 이러한 단계적 접근은 복잡한 시각 정보를 입히기 전, 음성 기반 AI의 효용성을 먼저 입증하려는 전략입니다. 구글은 검증된 안경 브랜드들과 협력함으로써 첨단 AI 기술을 일상적인 패션 아이템으로 자연스럽게 연결하고 있습니다. 이번 전략은 제미나이를 웹 브라우저와 앱이라는 틀에 가두지 않고, 사람들이 세상을 인식하고 상호작용하는 일상의 영역으로 넓히는 계기가 될 것입니다.

07AI가 알아서 팀을 꾸린다 — 여러 에이전트를 조율하는 새 도구

textcortex/spritz는 여러 분야의 AI 비서를 관리하는 복잡한 수동 설정을 자동화하는 오픈소스 도구입니다. 이 도구는 여러 AI 구성 요소의 활동을 조정하는 지휘자(orchestrator) 역할을 수행합니다. 사용자가 높은 수준의 목표를 제시하면, 이 시스템은 목표를 잘게 쪼개어 각 작업에 가장 적합한 AI 에이전트를 자동으로 배치합니다. AI 일꾼을 문제에 할당하는 과정이 자동화되면서, 사람이 일일이 관리해야 했던 번거로움이 사라지고 훨씬 유연한 업무 흐름(workflow)이 가능해졌습니다.

이 기술이 가장 빛을 발하는 분야는 오류 보고입니다. 소프트웨어를 실제 사용자에게 배포하는 과정에서는 예상치 못한 버그가 자주 발생합니다. 기존에는 개발자가 직접 문제를 찾아내고 해결할 도구를 지정해야 했지만, textcortex/spritz는 오류가 발생하면 즉시 해당 문제를 해결할 수 있는 전문 에이전트를 자동으로 투입합니다. 덕분에 기술적 결함이 발생 즉시 적절한 능력을 갖춘 에이전트에 의해 처리되며, 소프트웨어 안정성을 유지하는 과정이 한층 매끄러워졌습니다.

이런 도구가 필요한 이유는 현재의 대화형 플랫폼들이 가진 한계 때문입니다. 지금은 개발자가 여러 개의 서로 다른 AI 에이전트를 만들려면 에이전트마다 일일이 수동 작업을 거쳐야 합니다. 슬랙(Slack) 앱을 따로 만들고, 앱 설정 파일을 구성하고, 각 에이전트의 개성을 살리기 위해 프로필 사진을 직접 올리는 식입니다. 대부분의 대화형 앱은 여러 에이전트를 쉽게 생성하고 배치하는 다중 에이전트 프로비저닝(multi-agent provisioning) 기능을 표준화하지 않았습니다. textcortex/spritz는 이러한 조율 과정을 코드로 처리함으로써, 개발자가 메뉴를 클릭하며 시간을 낭비하거나 관리 업무에 치여 AI 인력을 늘리지 못하는 상황을 해결합니다.

08Qwen 3 6B, 논리적 사고력 강화로 덩치 큰 모델을 넘본다

AI 모델은 이제 단순히 다음 단어를 예측하는 수준을 넘어, 논리적 단계를 스스로 밟아가는 '사고 과정'을 학습하며 복잡한 문제를 해결하고 있습니다. Qwen 3 6B 모델의 경우, 단계별 사고 방식(chain-of-thought) 데이터셋을 활용한 미세 조정(fine-tuning)을 통해 논리적 추론 능력을 획기적으로 끌어올렸습니다. 모델은 이제 문장을 완성하는 대신, 중간 추론 과정을 차례로 생성하도록 훈련됩니다. 이러한 변화는 작은 모델도 거대 모델의 전유물이었던 깊이 있는 논리력을 갖추게 함으로써, 더 정교한 과업을 정확하게 수행할 수 있게 합니다.

이러한 성능 개선은 허깅페이스 허브(Hugging Face Hub)와의 긴밀한 통합 덕분에 한층 쉬워졌습니다. 사용자는 이제 소프트웨어 관리용 텍스트 도구인 명령줄 인터페이스(CLI)를 통해 이러한 추론 강화 기능을 적용할 수 있으며, 허브가 제공하는 그래픽 처리 장치(GPU)를 빌려 필요한 연산 자원을 확보할 수 있습니다. 이는 자체 클라우드 하드웨어의 성능이 부족하거나 Qwen 3 6B 모델을 돌리기에 적합하지 않은 개발자들에게 매우 유용합니다. 작업 흐름을 최적화된 허브 인프라로 옮기는 것만으로도, 값비싼 하드웨어를 새로 구축할 필요 없이 속도와 성능을 동시에 잡을 수 있습니다.

개발자들은 이러한 추론 능력이 실제로 효과적인지 검증하기 위해 업스킬(upskill)이라는 오픈소스 라이브러리를 활용합니다. 이 도구는 특정 기술을 자동으로 생성하고 이를 측정할 성능 시험(evals)까지 수행해, 저렴한 오픈 모델을 실무에 도입하는 관문 역할을 합니다. 업스킬은 기술을 생성하고 이를 검증할 테스트를 만든 뒤, 서로 다른 모델이 동일한 과업에서 어떤 성과를 내는지 비교하게 해줍니다. 이 엄격한 비교 과정은 미세 조정을 거친 오픈 모델이 거대 모델과 충분히 경쟁할 수 있음을 입증하며, 기업들이 비싼 폐쇄형 AI 서비스에 의존하지 않고도 높은 수준의 추론 능력을 유지할 수 있는 길을 열어줍니다.

09AI 설정 파일로 행동을 바꾼다 — 코드 수정 없는 맞춤형 제어

이제 프로그래머가 AI 도구의 핵심 엔진을 일일이 다시 짤 필요가 없습니다. 사용자는 외부 설정 파일만으로 AI의 행동 방식을 직접 조정할 수 있게 됐습니다. 즉, 복잡한 내부 평가 틀(harness)을 건드리지 않고도 특정 프로젝트에 맞춰 자율 행동 시스템(agentic system)을 최적화할 수 있다는 뜻입니다. 예를 들어, 클로드 코드(Claude Code) 같은 도구는 'agent.md' 파일이나 특정 기술(skills)을 입력하는 것만으로 업무에 딱 맞는 상태로 변합니다. 이 방식을 활용하면 소프트웨어의 복잡한 내부 구조를 몰라도 AI가 현장에서 요구하는 방식대로 즉각 움직이게 만들 수 있습니다.

이런 맞춤화 과정을 효과적으로 수행하려면 전체적인 지침과 구체적인 실행 단계를 명확히 구분해야 합니다. 'claude.md' 같은 파일에 저장되는 전역 규칙(global rules)은 AI가 어떤 작업을 하든 반드시 지켜야 할 환경의 법이자 제약 사항입니다. 모든 행동의 일관성을 유지하는 기준점 역할을 합니다. 반면, 기술(skills)은 실제 업무 흐름(workflow) 그 자체입니다. 기술은 AI가 복잡한 작업을 완수하기 위해 따라가는 재사용 가능한 프롬프트나 정의된 단계의 집합입니다. 규칙이 행동의 범위를 정한다면, 기술은 실행을 위한 지도 역할을 합니다.

이러한 구분은 일반적인 AI가 감당하기 어려운 대규모 소프트웨어 프로젝트에서 특히 빛을 발합니다. 예를 들어, 개발자는 방대한 코드베이스 내에서 API 경로를 추가하는 작업에 특화된 기술을 하나 만들어둘 수 있습니다. 매번 전체 과정을 설명할 필요 없이, 필요할 때마다 AI가 꺼내 쓸 수 있는 미리 정의된 업무 흐름을 제공하는 것입니다. 이렇게 운영 기술을 전역 규칙과 분리하면, 기업은 핵심 소프트웨어의 안정성을 해치지 않으면서도 AI의 능력을 확장하고 반복적이고 복잡한 과정을 정교하게 다듬을 수 있습니다. 이 계층적 접근 방식은 AI를 단순한 범용 도구에서 기업의 특정 도메인과 운영 요구사항에 맞춰진 전문 자산으로 탈바꿈시킵니다.

10안드레 카파시가 앤스로픽을 선택했다 — 안전이 곧 기술의 미래다

안드레 카파시(Andrej Karpathy)가 앤스로픽에 합류한 것은 인공지능 업계 전체에 강력한 신호를 보낸 사건입니다. 오픈AI의 공동 창업자이자 업계에서 가장 존경받는 연구자인 그가 어디든 갈 수 있는 위치에서 앤스로픽을 택했다는 것은, 그가 이 회사의 기술적 방향성에 깊이 공감하고 있음을 의미합니다. 이미 막대한 부를 쌓은 그에게 이번 결정은 금전적 보상이 아닌, 기술적 신념의 결과입니다. 이는 카파시가 앤스로픽을 인공지능을 가장 안전하게, 혹은 유일하게 제대로 구현할 수 있는 조직으로 보고 있다는 방증입니다.

이번 합류는 앤스로픽이 고수해 온 엄격한 인공지능 안전 정책에 대한 공식적인 지지 선언으로 해석됩니다. 카파시는 앤스로픽의 세계관, 즉 기술의 부작용을 경계하는 신중한 접근법을 자신의 것으로 받아들였습니다. 특히 사회적 영향에 대한 시각에서 두 주체는 일치합니다. 그는 인공지능 도입으로 인한 일자리 감소가 현실적이고 심각한 타격이 될 것이라는 앤스로픽의 비관적 전망에 동의하며, 기술이 도입되면 경제가 매끄럽게 전환될 것이라는 낙관론과는 선을 긋고 있습니다.

카파시가 가진 상징성은 이번 이동의 무게를 더합니다. 그는 오랫동안 인공지능 커뮤니티에서 교육과 기술 낙관론을 상징해 온 인물입니다. 그런 그가 오픈소스 개발의 위험성과 경제적 혼란 가능성을 경고하는 앤스로픽의 신중한 철학을 선택했다는 점은 큰 의미를 갖습니다. 업계를 가장 긍정적으로 바라보던 개발자조차 이제는 안전을 최우선으로 하는 엄격한 틀이 미래 산업의 필수 표준이라고 결론 내린 것입니다.

11구글, 매달 3200조 개 토큰 처리하며 AI 학습 속도 7배 높였다

구글은 방대한 정보를 처리하는 능력을 앞세워 인공지능의 진화 속도를 비약적으로 끌어올리고 있다. AI가 언어를 이해하고 생성하는 최소 단위인 토큰(token) 처리량이 폭발적으로 늘어났기 때문이다. 2년 전 구글의 월간 토큰 처리량은 약 9조 7000억 개 수준이었으나, 지난해 구글 I/O 행사 당시에는 480조 개로 급증했다. 현재 구글은 매달 3200조 개 이상의 토큰을 처리하고 있으며, 이는 전년 대비 7배 증가한 수치다. 이러한 압도적인 규모는 과거에는 불가능했던 수준의 데이터 밀도로 실제 복잡한 문제들을 해결할 수 있게 만든다.

이러한 성장의 상당 부분은 내부 활용에서 비롯되며, 이는 모델 성능을 정교하게 다듬는 데 결정적인 우위를 제공한다. 지난 3월 구글의 내부 일일 토큰 처리량은 5000억 개였으나, 현재는 3조 개를 넘어섰다. 이러한 급증세는 AI 개발 도구들이 강력한 피드백 순환 구조를 형성한 결과다. 개발자들이 내부 도구를 사용할수록 발생하는 데이터가 구글 모델을 실시간으로 개선하는 밑거름이 되며, AI는 실제 사용 패턴과 개발 현장의 요구에 맞춰 진화한다.

구글은 이러한 성장세를 유지하기 위해 시스템 구축과 학습 방식을 근본적으로 바꿨다. 현재 구글은 처리 지연 시간(latency)을 획기적으로 줄이면서 속도와 에너지 효율을 극대화하도록 설계된 TPU8 칩을 활용하고 있다. 또한, 잭스(Jacks)와 패스웨이(Pathways) 기술을 도입해 단일 데이터 센터의 물리적 한계에서도 벗어났다. 이제 AI 학습은 전 세계 100만 개 이상의 TPU 네트워크에 걸쳐 매끄럽게 분산 처리된다. 이는 세계 최대 규모의 학습 클러스터를 구축한 것으로, 구글은 기존에 수개월이 걸리던 대규모 모델 개발을 단 몇 주 만에 끝낼 수 있게 됐다. 인프라의 이러한 변화는 하드웨어가 폭증하는 토큰 처리 수요를 충분히 감당할 수 있도록 뒷받침한다.

12클로드 코드, 반복 업무를 '기술'로 학습해 자동화한다

개발자들은 이제 클로드 코드를 단순한 보조 도구를 넘어, 복잡한 기술적 과제를 반복적으로 처리할 수 있는 전문 팀원으로 활용할 수 있게 됐다. 핵심은 '기술(Skills)' 기능이다. 사용자는 특정 작업 방식을 기술로 정의해 클로드 코드에 학습시킬 수 있다. 이렇게 하면 AI는 범용적인 코딩 도우미에서 벗어나, 프로젝트의 고유한 요구사항을 완벽히 이해하고 검증된 방법론에 따라 업무를 수행하는 맞춤형 동료로 진화한다.

기술의 본질은 재사용 가능한 프롬프트나 구조화된 작업 단계의 집합이다. 개발자가 복잡한 과정을 매번 일일이 설명할 필요 없이, 특정 기술을 호출하는 것만으로 AI가 알아서 무거운 작업을 처리한다. 예를 들어, 서로 다른 소프트웨어 구성 요소를 연결하는 통로인 API 경로를 추가할 때, 미리 정의된 기술을 사용하면 된다. 여러 단계를 거쳐야 했던 수동 작업이 AI의 안정적인 실행을 통해 단번에 간소화된다.

이러한 기능은 방대한 코드 기반을 다루는 대규모 프로젝트에서 특히 빛을 발한다. 기업 환경에서는 수백 가지의 다양한 작업이 얽혀 있고, 각각의 상황에 맞는 접근 방식이 필요하다. 기술은 클로드 코드의 능력을 확장하는 핵심 장치다. 앤스로픽은 이를 통해 소프트웨어의 복잡도가 높아져도 함께 확장할 수 있는 AI 기반을 마련했다. 반복되는 패턴을 모듈 형태의 기술로 만들어두면, 조직 전체에서 관리하는 업무 흐름(workflow)이 아무리 많아져도 일관성과 효율성을 유지할 수 있다.