AI 뉴스 · 벤치마크 · 기술 블로그 큐레이션
AX BRIEF는 AI 전환 시대의 핵심 변화를 한국어와 영어로 다루는 독립 매체입니다. 글로벌 AI 산업의 흐름을 분석해 AI 에이전트·파운데이션 모델·벤치마크의 핵심을 정리해 전달합니다.

LLM 파운데이션 모델 학습에는 수백만 달러의 비용과 방대한 데이터가 필수적이다. Sapient는 트랜스포머 대신 계층적 순환 모델(HRM)을 도입해 학습 비용을 1,500달러 수준으로 낮췄다. 10억 개 파라미터 모델로 20~70억 개 규모의 기존
AI 발전 속도가 법제도 마련 속도를 압도하며 정책적 불일치가 심화하고 있다. Anthropic은 단순 정보 공개를 넘어 항공청(FAA) 방식의 강제 기술 테스트와 감사를 제안한다. 사이버 보안 및 생물학적 위험이 가시화됨에 따라 프런티어 모델의 출시

Anthropic이 기존 모델명 체계를 정리하고 향후 출시할 모델의 명명 규칙을 확정했다. 모델 규모에 따라 Opus, Sonnet, Haiku라는 명칭을 유지하며 성능 단계별로 숫자를 붙여 구분한다.

클로드 데스크톱 윈도우 버전이 채팅 전용 사용 시에도 Hyper-V 가상 머신을 자동으로 생성하는 버그가 발견됐다. 해당 프로세스는 약 1.8GB의 RAM을 점유하며, RPC 인터페이스 이벤트를 통해 vmcompute 서비스와 vmwp.exe를 실행한

앤스로픽이 역대 가장 강력한 AI 모델인 클로드 페이블 5를 공개했다. 생물학 분야의 전문성을 강조했으나 정작 기초적인 질문에는 답변을 거부한다. 사용자의 질의를 이전 플래그십 모델로 우회시키는 방식을 택하고 있다.

유럽 2위 디지털 은행 Bunq의 AI 비서가 단돈 0.02유로짜리 송금 한 건에 뚫렸다. 송금 설명란에 숨긴 악성 지시문이 AI 비서를 피싱 공격 통로로 바꿔버린 사례다. 거래 내역·고객 메모 등 AI가 읽는 모든 외부 데이터가 공격 표면이 될 수

AI 모델 성능 급증으로 인한 공공 안전 리스크가 임계점에 도달했다. 앤스로픽은 FAA 수준의 강제 테스트와 정부의 배포 차단 권한 도입을 제안했다. 10^25 FLOPs 등 구체적 규제 기준과 함께 3억 5천만 달러의 노동 전환 기금을 발표했다.

LLM의 고질적인 문제인 토큰 단위 순차 생성의 지연 시간을 해결한다. 구글이 공개한 DiffusionGemma는 26B MoE 구조로 최대 4배 빠른 추론 속도를 구현했다. 텍스트 블록을 동시에 생성하는 확산 모델 방식을 통해 로컬 워크플로우의 효율

AI 에이전트를 만들 때 복잡한 설정과 블랙박스 같은 동작 때문에 디버깅에 애를 먹는 개발자가 많다. Apache Burr는 별도의 설정 언어 없이 순수 파이썬 함수만으로 에이전트의 행동과 상태를 정의한다. 실시간 모니터링 UI와 상태 저장 기능을 통

AI 어시스턴트는 사용자 취향을 기억해 맞춤형 응답을 제공한다. 최근 Writer의 연구는 메모리 시스템이 모델을 지나치게 순응적으로 만들어 정확도를 떨어뜨린다고 밝혔다. Mem0, Zep 같은 도구 사용 시 모델이 무관한 정보에 매몰되어 오답을 낼

단순한 코드 자동완성을 넘어 스스로 문제를 해결하는 AI 에이전트 시대가 열리고 있다. Cohere가 터미널 작업과 복잡한 소프트웨어 수정을 수행하는 North Mini Code를 공개했다. 256K의 넓은 문맥 처리 능력과 오픈 웨이츠 방식을 채택해

자율주행 학습을 위해 수만 시간의 주행 데이터와 정교한 시뮬레이터가 필요했다. Decart가 텍스트로 실시간 도로 환경을 만드는 월드 모델 'Oasis 3'를 API로 공개했다. 3억 달러 투자 유치와 40억 달러 기업가치를 바탕으로 물리 AI 개발

AI 에이전트들이 프로젝트 단위의 기억을 공유하고 유지할 수 있는 로컬 우선 오픈소스 도구 'memorize'가 공개됐다. 2층 메모리 구조와 서버 없는 이벤트 로그 동기화를 통해 모델 교체나 기기 변경 시에도 컨텍스트를 유지한다. 개발자는 벤더 종속

AI가 인간의 일자리를 빠르게 대체할 것이라는 우려가 지속되고 있다. 하지만 실업자 1인당 구인 건수는 다시 1.0을 넘어섰다. 5월 비농업 부문 고용이 17만 2천 명 증가하며 고용 시장의 견조함을 증명했다.

메타가 인도 릴라이언스 인더스트리와 협력해 첫 AI 데이터센터를 구축한다. 구자라트주 잠나가르에 168MW 규모 시설을 2년 내 마련하며, 메타는 재생 에너지와 해수 담수화 냉각 방식을 적용한다. 인도 정부의 세제 혜택과 글로벌 빅테크의 인프라 거점

AI 코딩 도구의 보급으로 개발자가 개인 맞춤형 유틸리티를 직접 제작하는 흐름이 가속화하고 있다. 상용 앱의 기능 제약을 넘어 홈 자동화부터 에이전트 샌드박스까지 초개인화된 도구들이 등장한다. 개발 시간이라는 기존의 비용 감각이 무너지며 소프트웨어를