우리가 AI에게 조금만 위험해 보이는 질문을 하면 AI는 곧바로 거절합니다. 도덕적으로 옳지 않다거나 안전하지 않다는 이유로 대화를 끊어버립니다. 너무 착하게 만들어진 AI 때문에 정작 필요한 정보를 얻지 못해 답답했던 경험이 있을 것입니다. 그런데 만약 이런 거절하는 습관을 완전히 지워버린 AI가 있다면 어떨까요?

Google 모델 310억 개 지식과 거절 없는 답변

최근 개발자 커뮤니티에 Google이 만든 AI 모델을 개조한 새로운 버전이 공개되었습니다. 이 모델은 HuggingFace(AI 모델을 모아놓은 도서관 같은 곳)라는 곳에 올라와 누구나 가져갈 수 있습니다. 원래 AI는 나쁜 말을 하지 않도록 아주 튼튼한 안전장치가 걸려 있습니다. 하지만 어떤 개발자들은 이 장치가 너무 심해서 공부나 연구에 꼭 필요한 정보까지 막아버린다고 생각했습니다.

비유하자면 입에 재갈을 물려놓은 것과 비슷합니다. 그래서 개발자들은 Abliterated(거절하는 습관을 지운 기술)라는 특별한 방법을 사용했습니다. 쉽게 말하면 AI의 뇌 속에서 거절을 담당하는 특정 부위를 찾아내어 그 연결 고리를 끊어버린 것입니다. 이제 AI는 더 이상 눈치를 보지 않고 질문에 답하게 되었습니다. 이 과정을 통해 AI는 웬만한 질문에는 모두 답하는 솔직한 성격으로 변했습니다.

보안 전문가를 위한 비밀 과외 선생님의 등장

이 AI는 단순히 말만 잘하는 것이 아니라 Multimodal(글자와 그림을 모두 이해하는 능력) 기능까지 갖췄습니다. 사진을 보여주며 질문해도 척척 대답하고 스스로 깊게 생각해서 답을 내놓습니다. 일반적인 AI가 엄격한 학교 선생님 같다면 이 모델은 무엇이든 알려주는 비밀 과외 선생님과 같습니다.

이런 특징은 특히 보안 전문가들에게 큰 도움이 됩니다. 보안 전문가는 나쁜 해커들이 어떤 수법을 쓰는지 알아야 더 튼튼한 방어벽을 세울 수 있습니다. 하지만 일반 AI는 해킹 수법을 알려달라고 하면 위험하다며 거절합니다. 반면 이 모델은 일반 AI가 숨기는 비밀스러운 코드까지 모두 가르쳐줍니다.

물론 공짜로 얻은 자유에는 대가가 따릅니다. AI의 전반적인 지식 수준을 재는 MMLU(AI의 지식 수준을 측정하는 시험) 점수가 이전보다 조금 낮아졌습니다. 너무 솔직하게 답하려다 보니 정답을 정확하게 맞히는 능력이 살짝 줄어든 것입니다. 결국 안전장치를 없애면 자유로운 답변을 얻는 대신 지식의 정확도가 조금 떨어질 수 있습니다.

맥 컴퓨터 32기가바이트 메모리로 돌리는 방법

이 솔직한 AI를 내 컴퓨터에서 직접 사용하려면 몇 가지 준비물이 필요합니다. 우선 Apple Silicon(애플이 만든 컴퓨터 칩)이 들어간 맥 컴퓨터가 있어야 합니다. 여기에 vMLX(맥 컴퓨터에서 AI를 빠르게 돌려주는 도구)라는 프로그램을 설치하면 준비가 끝납니다.

이 모델은 310억 개의 Parameters(AI가 공부한 지식의 양을 나타내는 숫자)를 가지고 있습니다. 쉽게 말하면 AI가 머릿속에 저장한 정보 조각이 310억 개나 된다는 뜻입니다. 덩치가 매우 크기 때문에 이를 담아낼 넓은 공간이 필요합니다. 비유하자면 아주 두꺼운 백과사전을 펼쳐놓고 공부하려면 책상이 아주 넓어야 하는 것과 같습니다.

그래서 컴퓨터의 기억 장치인 메모리가 32기가바이트 이상일 때 가장 매끄럽게 작동합니다. 메모리가 부족하면 AI가 생각하는 속도가 매우 느려지거나 아예 멈출 수 있습니다. 내 컴퓨터의 성능이 충분하다면 누구나 이 자유로운 AI를 개인 비서처럼 활용할 수 있습니다.

AI가 정해진 규칙의 틀을 깨고 어디까지 솔직해질 수 있을지 지켜볼 때입니다.