발표에서 확인된 핵심 사실

대학생들에게 생성형 AI는 이제 과제 작성이나 시험 준비를 돕는 일상적인 도구가 됐다. 하지만 도구의 편의성이 부정행위의 경계를 허물며 아이비리그의 권위마저 흔드는 사건이 터졌다. 브라운 대학교(Brown University)의 해리슨 S. 크라비스 대학교 경제학 교수인 로베르토 세라노(Roberto Serrano)가 자신이 가르치는 수학 경제학 전공 심화 과정인 ECON 1170 강의에서 대규모 AI 부정행위를 적발했다.

세라노 교수는 지난 3월 5일에 실시한 중간고사에서 최소 50명의 학생이 부정행위를 저질렀다는 결정적인 증거를 확보했다. 이는 브라운 대학교라는 개별 교육 기관의 문제를 넘어, 아이비리그(Ivy League) 전체에서 지금까지 알려진 가장 큰 규모의 스캔들로 기록됐다. 학술적 엄밀함이 요구되는 전공 심화 과정에서 이 정도 규모의 조직적 부정행위가 발생했다는 점이 사태의 심각성을 더한다.

부정행위의 징후는 비정상적인 고득점 결과에서 명확히 드러났다. 100점 만점의 시험에서 평균 점수는 96점에 달했으며, 무려 40명의 학생이 만점을 기록하는 이례적인 상황이 벌어졌다. 시험지를 교정한 인원들이 세라노 교수에게 보고한 정황에 따르면, 일부 답변에서 ChatGPT(챗GPT)에 특정 질문을 입력했을 때만 출력되는 특이한 구절들이 학생들의 답안지와 정확히 일치했다.

이번 사건은 AI가 생성한 정답이 인간의 학습 성과로 둔갑해 평가 시스템을 무력화한 사례다. 단순한 개별 학생의 일탈을 넘어, 생성형 AI의 보급이 기존의 평가 방식과 신뢰 구조를 어떻게 파괴하는지 구체적인 수치로 증명했다.

대면 시험으로 전환하자 성적이 급락하며 AI 부정행위의 실증적

평균 100점과 48점이라는 극단적인 점수 차이가 한 강의실에서 발생했다. Roberto Serrano 교수가 기말고사를 대면 방식으로 전환하자 학생들의 평균 점수가 48점으로 급락했다. 중간고사에 응시한 89명 중 기말고사에 결석한 학생은 27명이었다. 이들 결석자 중 22명이 중간고사에서 만점을 기록했다는 사실은 AI를 이용한 부정행위의 강력한 정황이 된다. AI를 활용해 답안을 작성했던 학생들이 대면 시험이라는 통제 환경에 노출되자 성적이 수직 하락한 것이다. Roberto Serrano 교수는 이러한 수치를 근거로 부정행위의 실증적 증거가 압도적이라고 확언했다.

Serrano 교수는 고등 교육의 미래를 보존하기 위해 AI 문제에 대한 공개적인 논의가 시급하다고 주장한다. 학문적 정직성은 대학이 끝까지 수호해야 할 핵심 가치이며, 대학 당국이 현재 상황의 심각성을 공개적으로 인정하는 것이 우선이다. 개별 교수진이 홀로 싸우게 두는 방식으로는 AI가 가져온 파괴적인 영향을 막을 수 없으며, 이는 고등 교육의 존립이 걸린 결정적인 전투와 같다. 문제의 실제 범위에 대해 학내 구성원들이 폭넓은 토론을 시작해야 한다. 대학이 이 문제를 공론화하고 실질적인 대응책을 마련하는 과정이 앞으로의 교육 신뢰도를 결정한다.

확인해야 할 핵심 지점

과제 제출 버튼을 누르면 모든 과정이 끝났던 평가 방식이 사라진다. Roberto Serrano 교수는 다음 학년도부터 AI로 해결 가능한 주간 과제를 최종 성적 산출 범위에서 완전히 제외한다. AI가 정답을 쉽게 도출할 수 있는 문항들이 성적에 반영되는 것을 막아 평가의 변별력을 확보하려는 조치다. 주간 과제가 학습 보조 수단이 아닌 AI의 단순 출력물로 전락했다는 판단이 작용한 결과다. 또한 시험의 성격이나 적절성 여부와 관계없이 집에서 답안을 작성해 제출하는 테이크홈(take-home) 방식의 시험을 전면 폐지한다. 해당 방식이 시험 목적에 부합하는 적절한 도구였는지와는 무관하게 AI 부정행위의 통로가 된다면 제거한다는 방침이다. 결과물 제출만으로 학생의 능력을 측정하던 기존 방식을 버리고 교수자의 직접 감독 하에 수행하는 실시간 검증 체계로 회귀한다.

Brown University 당국은 이러한 대규모 부정행위 정황에 대해 미온적인 반응을 보였다. Serrano 교수가 사건의 심각성을 보고했을 때 총장은 절대적인 침묵으로 일관했고 학장 역시 관련 언급을 회피했다. 대학 지도부가 AI로 인한 학문적 정직성 훼손 문제를 즉각적으로 인지하지 않았음을 보여준다. 이후 학업 윤리 규정을 심의하는 Academic Code Committee에 사건이 공식 접수된 후에야 이번 일이 경종(wake-up call)이 되었다는 짧은 메모를 전달받았다. 대학 내 공식 기구가 나서서야 사태의 심각성을 인정한 셈이다. 현장의 위기감이 행정 체계로 전달되기까지 상당한 시차가 발생하며, 이는 기술의 확산 속도를 제도가 따라잡지 못하는 간극을 그대로 드러낸다.

ChatGPT로 과제를 해결하는 대학생들의 일상은 이제 보편적인 풍경이다. 브라운대 ECON 1170의 성적 폭락과 프린스턴대의 명예 규율 폐지는 AI가 기존의 신뢰 기반 평가 체계를 완전히 무너뜨렸음을 증명한다.

성과 측정의 기준은 이제 결과물 제출에서 실시간 과정 검증으로 회귀한다. 평가의 본질이 제출된 결과값이 아니라 수행하는 과정 그 자체를 확인하는 방식으로 바뀐다.