디지털 생산성 환경이 빠르게 변하고 있다. 정보 수집과 공동 집필, 그리고 AI 성능 검증 방식을 효율화하는 새로운 도구들이 쏟아지고 있기 때문이다.
이번 주에는 복잡한 조사 업무 흐름(workflow)을 획기적으로 줄여줄 자동 데이터 추출 기술과, 더 직관적인 공동 집필 방식을 제안하는 새로운 협업 툴을 살펴본다. 단순한 도구의 변화를 넘어, 업계의 시선은 이제 '검증'으로 향하고 있다. 새로운 AI 모델의 지능을 어떻게 엄격하게 측정하고, 그 성능이 실제인지 증명할 것인가에 대한 논의가 다시 뜨거워지는 추세다.
더불어 복잡한 시각 자료를 구현하는 AI의 창의적 진화와, 흩어져 있는 여러 작업을 하나로 통합해 관리할 수 있는 새로운 오픈소스 작업 환경도 함께 짚어본다. 데이터 처리 자동화부터 아이디어의 시각화까지, 지금 이 순간 디지털 업무 환경을 재편하고 있는 핵심 도구들의 현주소를 정리했다.
01채팅창을 벗어난 AI — 문서 편집기로 진화한 글쓰기 도구
AI와 함께 글을 쓰는 방식이 단순한 채팅에서 본격적인 문서 협업으로 옮겨가고 있다. 제미나이의 캔버스(Canvas)는 아예 워드 프로세서처럼 작동해 가장 완성도 높은 경험을 제공한다. 챗GPT의 인라인 캔버스나 클로드의 수정 불가능한 아티팩트(Artifacts)와 달리, 제미나이는 제목 설정, 굵게 하기, 글머리 기호, 수식 입력 등 텍스트를 직접 편집할 수 있다. 편집 기능은 제미나이가 앞서지만, 문장력과 인간다운 표현력은 클로드가 우위에 있다는 평가가 많다. 특히 사용자가 직접 쓴 문서를 학습시켜 AI가 자신의 말투와 톤을 그대로 흉내 내게 만드는 맞춤형 스타일 기능이 강력하다. 기능은 제미나이, 감성은 클로드다.
단순한 인터페이스를 넘어, 개인 데이터와 AI를 연결하는 능력은 이제 전문적인 업무 흐름(workflow) 자체를 바꾸고 있다. 클로드 코워크(클로드 Co-work)는 한 발 더 나아가 데스크톱 앱 형태로 작동하며 로컬 폴더 접근 권한을 갖는다. AI가 내 컴퓨터에서 직접 파일을 만들고 수정할 수 있어, 송장 관리나 코드 작성 같은 실무 작업에 매우 유용하다. 클로드는 지메일, 구글 드라이브, 노션 등 다양한 외부 서비스 연결은 물론, 재피어(Zapier)를 통해 확장성도 확보했다. 반면, AI가 정해진 정보 안에서만 답하길 원하는 사용자에게는 노트북LM(Notebook LM)이 정답이다. 특정 웹사이트나 파일, 영상을 업로드하면 AI가 오직 그 자료만을 근거로 답변하는 '근거 기반(grounded)' 경험을 제공하기 때문이다. AI가 내 컴퓨터의 파일을 직접 만지는 시대가 왔다.
하지만 이런 매끄러운 협업 경험을 방해하는 가장 큰 걸림돌은 사용량 제한이다. 월 20달러의 표준 유료 플랜 기준으로 사용량 소진 속도는 클로드가 가장 빠르고, 제미나이가 그 뒤를 잇는다. 챗GPT가 가장 관대하다. 결정적인 차이는 제한 이후의 처리 방식에 있다. 챗GPT와 제미나이는 '대체 모델 전환(fallback)' 시스템을 갖췄다. 주력 모델의 제한이 끝나면 성능이 낮은 하위 모델로 자동 전환해 서비스 끊김 없이 계속 쓸 수 있게 한다. 클로드는 이 기능이 없다. 정해진 사용량을 다 쓰는 순간, 서비스 이용이 완전히 차단된다. 성능보다 무서운 건 갑작스러운 접속 차단이다.
02Bright Data — 깨진 코드 스스로 고치는 자동 스크래퍼
이제 기업들은 사람이 일일이 코드를 수정하고 감시하지 않아도 웹 스크래퍼를 안정적으로 운영할 수 있다. Bright Data가 선보인 솔루션의 핵심은 '자동 복구' 기능이다. 웹사이트의 가공되지 않은 복잡한 코드를 기업이 즉시 사용할 수 있는 정돈된 형태로 바꿔주는 데이터 추출 도구(parser)가 고장 났을 때, 이를 스스로 감지하고 수정한다. 보통 웹사이트는 레이아웃을 자주 변경하며, 이때마다 추출 도구가 작동을 멈춰 엔지니어들이 복구에 수 시간을 허비하곤 했다. Bright Data는 이 과정을 자동화했다. 예를 들어 클로드(클로드) 내에서 30분마다 실행되도록 설정해두면, 시스템이 스스로 오류를 찾아내고 사람의 개입 없이 수리한다. 관리의 시대가 끝난 셈이다.
이런 자동화는 AI 운영 비용 절감으로 직결된다. AI 모델이 데이터를 추출할 때 사용하는 '토큰(token)'은 곧 비용이다. 웹페이지를 만드는 표준 언어인 HTML 전체를 그대로 처리하는 방식은 불필요한 코드가 너무 많아 비용 낭비가 심하다. Bright Data는 전체 HTML 문서를 읽는 대신, 꼭 필요한 데이터만 골라내는 전용 추출 도구를 구축해 작업 흐름(workflow)을 최적화했다. 불필요한 데이터 처리에 돈을 쓰는 일을 막아 토큰 소모량을 획기적으로 줄인 것이다.
기술적 효율을 넘어 법적 근거까지 확보했다. Bright Data는 Meta와 일론 머스크가 제기한 소송에서 승소하며 자동 수집의 정당성을 입증했다. 로그인이나 비공개 계정 뒤에 숨겨진 정보가 아닌, 오직 '공개 데이터'만 다룬다는 엄격한 원칙을 고수한 결과다. 법원은 수집 방법이 자동화되었더라도 공개된 데이터라면 수집이 가능하다는 판결을 내렸다. 스스로 고치는 기술에 명확한 법적 가이드라인이 더해졌다. 이제 기업은 기술적, 법적 리스크 없이 대규모 데이터 수집 체계를 구축할 수 있게 됐다.
03AI가 진짜 일을 잘하는지 어떻게 증명할까?
AI가 실제로 시간을 아껴주거나 매출을 올리는지, 즉 비즈니스 가치를 창출하는지 확인하려면 단순한 '좋아요' 피드백만으로는 부족하다. 정밀한 검증이 필요하다. 개발자들은 모델의 정확도와 신뢰성을 측정하기 위해 전문적인 성능 시험 프레임워크(evaluation frameworks)를 도입한다. 가장 기초적인 단계는 입력과 출력 한 쌍만 확인하는 '스팬(span)' 평가다. 정해진 논리에 따라 결과가 나오는지 확인하는 방식이다. 예를 들어 AI의 답변이 필수 항목을 모두 갖춘 올바른 데이터 형식(JSON)인지 확인해, 사람이 일일이 검토하는 비용을 없애는 식이다.
AI 시스템이 복잡해질수록 평가의 범위와 깊이도 확장되어야 한다. 각 구성 요소가 어떻게 상호작용하는지 파악해야 하기 때문이다. '멀티 스팬(multi-span)' 평가는 여러 자율형 AI(AI agents) 사이에서 데이터가 오갈 때 정보가 누락되거나 왜곡되지 않는지 추적한다. 한 단계 더 나아가 '궤적(trajectory)' 평가는 AI가 특정 업무를 완수하기 위해 거친 전체 호출 순서를 검토해 올바른 경로를 밟았는지 검증한다. 가장 높은 단계인 '세션 수준(session-level)' 평가는 사용자 세션 전체의 밑바탕이 되는 논리 구조인 상태 머신(state machine)을 분석한다. 전반적인 사용자 경험을 진단하고, 사용자의 불만 섞인 반응 같은 실패 징후를 포착하는 단계다.
이제 검증 과정은 사람이 직접 설정하는 방식에서 자율적인 감시 체계로 진화하고 있다. Arize가 그리는 미래는 사람이 일일이 테스트 항목을 선택할 필요가 없는 세상이다. AI가 시스템 활동의 상세 기록인 실시간 트레이스(real-time traces)와 주변 맥락을 분석해, 필요한 성능 시험을 즉석에서 생성해 실행한다. 행동 변화가 감지되는 순간 자동으로 테스트를 트리거함으로써, 수동 개입으로 인한 병목 현상을 완전히 제거한다. 품질은 유지하면서 제품의 진화 속도는 극대화하는 전략이다.
04내 데이터가 서버로 안 간다: PewDiePie의 AI 도구 Odysius
이제 데이터를 기업 서버로 보내지 않고도 강력한 AI를 쓸 수 있다. 프라이버시의 주도권이 사용자에게로 넘어오는 지점이다. PewDiePie가 무료 오픈소스 AI 작업 환경 도구(wrapper)인 Odysius를 공개했다. 클라우드 컴퓨팅에 의존하는 대부분의 AI 비서와 달리, Odysius는 사용자의 컴퓨터에서 직접 작동한다. 대화 내용과 민감한 정보가 기기 밖으로 절대 나가지 않으므로, AI를 사용하는 방식의 보안 체계가 근본적으로 바뀐다. 외부 서버 의존성을 완전히 제거해, 사용자가 자신의 데이터에 대해 완전한 소유권을 갖는 사적인 대안을 제시한 셈이다.
진입 장벽을 낮추기 위해 Odysius는 컴퓨터 하드웨어 사양을 자동으로 스캔하는 기능을 넣었다. 내 기기에서 어떤 오픈소스 AI 모델이 돌아가는지 바로 확인하고, ChatGPT 같은 서비스의 핵심 엔진을 내 컴퓨터에서 직접 실행할 수 있다. 이 도구는 단순한 채팅창이 아니다. 파일 관리부터 프로그램 실행, 웹 리서치까지 수행하는 종합 생산성 도구다. 특히 사용자의 작업 스타일을 학습해 기억하는 기능이 있어, 쓰면 쓸수록 개인의 습관과 요구에 맞게 최적화된다.
Odysius의 등장은 로컬 AI 실행과 데이터 주권(data sovereignty)을 향한 거대한 흐름을 보여준다. 도구를 오픈소스로 풀면서, 중앙 집중형 AI 기업의 영향력에서 벗어나고 싶어도 비용과 기술 때문에 망설였던 사용자들의 장벽을 허물었다. 이제 내 프롬프트와 문서를 보호하기 위해 남의 회사를 믿을 필요가 없다. 디지털 환경의 통제권은 온전히 사용자에게 있다. 서버 기반 AI에서 로컬 하드웨어로의 전환은 개인에게 강력한 AI 기능을 업무 흐름(workflow)에 통합할 수 있는 권한을 준다. 클라우드 모델은 절대 흉내 낼 수 없는 수준의 보안이다.
05클로드 Mythos, 텍스트만으로 정밀 기기 도면을 구현한 AI
AI가 이제 단순한 텍스트나 이미지 생성을 넘어, 복잡한 물리적 객체를 구현하는 정밀한 코드를 짜기 시작했다. 클로드 Mythos는 텍스트 명령어만으로 게임 하드웨어의 정밀한 벡터 그래픽(SVG, 확대해도 깨지지 않는 이미지)을 생성하며 이를 증명했다. 이제 PS4나 PS5 컨트롤러 같은 전자 기기의 사실적인 외형을 구현하기 위해 굳이 전문 디자인 소프트웨어를 붙잡고 있을 필요가 없다. 디자인의 영역이 코드로 옮겨가고 있다.
특히 놀라운 점은 단 한 번의 시도(oneshotting)로 최종 코드를 완성한다는 것이다. 구체적인 지침만 있다면 시행착오 없이 결과물을 내놓는다. 실제로 닌텐도 스위치는 8분 25초 만에, PSP는 10분 46초 만에 구현했다. 특히 PSP의 경우 메모리스틱 알림 같은 운영체제(OS)의 세부 디테일까지 정확하게 묘사했다. 이는 사용자가 SVG 코드 구조를 어떻게 짜야 하는지 상세하게 지시하는 정밀 프롬프팅을 통해 가능했다. 단순한 흉내를 넘어 디테일의 영역까지 진입했다.
다만 시각적 완성도와 별개로, 막대한 계산 비용은 여전한 걸림돌이다. 단순한 논리 구조나 프론트엔드 디자인에 이런 고성능 모델을 쓰다 보면 AI가 처리할 수 있는 텍스트 양인 토큰 제한(token limit)에 금방 도달하고, AI의 단기 기억 용량인 컨텍스트 윈도우(context window)가 빠르게 채워진다. 하지만 클로드 Mythos의 등장은 그 자체로 산업의 기폭제가 된다. 고정밀 코드 생성이 가능하다는 것을 증명함으로써, 향후 일반 사용자도 훨씬 저렴한 비용으로 같은 성능을 누릴 수 있는 길을 열었기 때문이다. 비용의 문제는 시간이 해결하겠지만, 가능성의 증명은 이미 끝났다.
