학생들이 밤잠을 설치게 만드는 AIGC 시험은 정확히 무엇일까요?

이 기사는 기계로 번역되었습니다

원문 표시

2026년 졸업 시즌이 다가옴에 따라 대학 내 AIGC(인공지능 생성 콘텐츠) 탐지는 졸업생들에게 새로운 과제로 떠올랐습니다. 쓰촨대학교는 인문학 논문의 AI 생성 콘텐츠 비율을 20% 이하로, 광시사범대학교를 비롯한 여러 대학은 40% 이하로 제한하고 있습니다. AIGC 탐지는 '혼란도'와 '갑작스러움'이라는 두 가지 차원을 기반으로 하지만, 대규모 AI 모델의 빠른 반복 학습으로 인해 정확도에 대한 의문이 제기되고 있습니다. CCTV는 이 기술의 과학적 타당성에 대해 구체적으로 논의한 바 있으며, 심지어 '등태각서'와 같은 고전 문학 작품조차 100% AI 생성으로 오판된 사례가 있습니다. 업계에서는 현재 문제의 근본 원인을 해결하기 위해 디지털 워터마킹 기술을 활용하고 있지만, 텍스트 영역에서는 상당한 한계를 가지고 있습니다.

기사 작성자 및 출처: Sanyi Life

AIGC 탐지 원리를 이해하면 적절한 해결책을 찾을 수 있습니다.

"긴 정자 밖, 옛길을 따라 향기로운 풀들이 지평선까지 펼쳐져 있네. 언제 돌아올 거니? 돌아올 땐 망설이지 말고 와." 또 다른 졸업 시즌이 다가오면서, 2026년 졸업생들은 이별의 슬픔뿐 아니라 난관에 봉착한 AIGC(전국학연구원 자격시험)에 대면 하게 될지도 모릅니다. 올해 여러 대학의 단체 채팅방에서 끊임없이 논의되는 주제는 바로 "AIGC 시험 어떻게 통과할까?"입니다.

지금 인공지능을 가장 적극적으로 수용하는 집단을 꼽으라면, 노동 계층보다는 대학생일 가능성이 높습니다. 대학 강의실에서는 누가 더 열심히 공부하는지 경쟁하는 것이 아니라, 누가 인공지능 안내를 더 잘 활용하는지 경쟁한다는 농담까지 나올 정도입니다.

인공지능 생성(AIGC) 혁명이 시작된 지 4년째 되는 지금, 수많은 대학들이 졸업 논문 심사 과정에 AIGC 탐지 기능을 도입하기 시작했으며, 이제는 "검토될 수도 있다"가 아니라 "반드시 검토될 것"이 되었습니다.

예를 들어, 쓰촨대학교는 인문학 분야 졸업 논문에서 AI 생성 콘텐츠 점유비율 20% 이하로, 과학, 공학, 의학 분야에서는 15% 이하로 제한하고 있습니다. 광시사범대학교와 난징항공우주대학교는 AI 생성 콘텐츠의 비율을 40% 이하로 규정하고 있습니다. 또한, 현재 대학들은 기준 미달 논문에 대해 수정을 위해 반려하는 대신 논문 심사를 연기하는 방식으로 제재를 가하고 있습니다.

현재 샤오홍슈, 웨이보, 더우인 등의 플랫폼에서 "AIGC 탐지"를 검색하면 최근 졸업생들이 높은 AIGC 비율에 대해 불만을 토로하는 글들이 대량 눈에 띕니다. 이로 인해 AIGC 비율을 낮추는 이색적인 방법이나 도구에 대한 광고가 늘어나고, AIGC 탐지 자체에 대한 회의적인 시각도 확산되고 있습니다.

샤오홍슈의 한 사용자가 자신의 경험을 공유했습니다. VIP AIGC는 자신의 논문에서 AI 비율이 48%에 달하는 것을 감지했는데, 유료 도구를 사용해 수정해 봐도 AI 비율은 몇 퍼센트 포인트밖에 줄어들지 않았습니다. 그러다 문득 아이디어가 떠올랐습니다. 단어는 하나도 바꾸지 않고, 단 한 번의 검색으로 논문 전체의 쉼표를 마침표로 바꾸자 AI 비율이 즉시 11.51%로 떨어졌습니다.

게다가 누군가 주자청의 고전 수필 '달밤 연못'을 AIGC 탐지 도구에 제출한 결과, 놀랍게도 62.88%가 AI 생성물로 판명되었습니다. 뿐만 아니라 유자신의 '유랑지구' 역시 50% 이상의 AI 콘텐츠가 포함된 것으로 감지되었고, 시대를 초월한 명작 '등왕각 서문'은 100% AI로 분류되기도 했습니다.

AIGC 탐지를 둘러싼 혼란은 CCTV에서조차 이 기술의 과학적 타당성에 대해 논의하게 만들 정도였습니다. 그렇다면 AIGC 탐지는 왜 이렇게 결과가 무작위적으로 보이는 혼란스러운 것일까요? 이 질문에 답하기 전에 먼저 AIGC 탐지의 원리를 살펴보겠습니다. 현재 시중에 나와 있는 주류 AIGC 탐지 방법은 기본적으로 단어의 예측 가능성과 빈도 변화를 측정하는 "퍼플렉시티(perplexity)"와 "버스트니스(burstiness)"에 기반합니다.

인간의 인지 세계에서 텍스트는 의미와 논리를 전달하는 매개체이지만, 대규모 AI 모델의 관점에서는 세상이 토큰으로 축소됩니다. 트랜스포머 아키텍처 기반의 대규모 AI 모델은 본질적으로 문맥 내에서 가능한 각 토큰의 확률 분포를 계산하고, 가장 높은 확률을 가진 토큰을 선택하여 출력을 생성합니다. 이러한 과정은 AI가 관련 단어의 의미를 진정으로 이해하는 것이 아니라 통계적 예측에 의존합니다.

예를 들어, AI가 "어향육사(鱼香肉丝)를 먹고 싶어요"라는 텍스트를 받으면, 다음에 입력할 단어가 "돼지고기 채썰기(肉丝)"일 것이라고 예측합니다. 일부 똑똑한 AI는 어향육사의 가정식 레시피까지 제공하기도 합니다. AI는 글을 쓸 때 가장 가능성이 높은 단어를 선택하기 때문에, AIGC 탐지 도구에 특화된 AI 분석 도구에서는 이러한 글이 낮은 "혼란 수준"으로 인식됩니다.

갑작스러움이란 글의 구조적 규칙성을 의미합니다. 지나치게 완벽한 운율, 지나치게 규칙적인 논리, 그리고 지나치게 정형화된 단어 선택과 문장 구조를 가진 글은 갑작스러움이 높습니다. 예를 들어, AIGC가 "등왕각서문"을 100% AI로 감지한 것은 그 글이 "역대 최고의 병렬 산문"으로 칭송받아서가 아니라, 조화로운 운율과 병렬 구조와 같은 특징들이 AI의 눈에 너무 완벽하게 느껴지게 만들었기 때문입니다.

간단히 말해, AIGC 탐지의 기본 논리는 "추측"에 기반합니다. 즉, 내 기사가 AI 모델의 출력물과 얼마나 유사한지 추측하는 것입니다. AIGC 탐지 개발자들이 노력을 게을리하는 것이 아니라, AI 모델의 빠른 발전 속도 때문에 "AI가 AI를 탐지한다"는 말이 공허한 구호에 불과하게 된 것입니다.

사실, AI 업계는 아직 진정으로 신뢰할 수 있는 AI 콘텐츠 검사 도구를 개발하지 못했습니다. 현재 널리 사용되는 접근 방식은 AI 디지털 워터마킹 기술로, AI가 생성한 이미지와 비디오의 메타데이터에 보이지 않는 워터마크를 추가하여 근본적인 문제를 해결하려는 시도입니다. 이를 위해 마이크로소프트, 구글, 어도비, 오픈AI, 메타 등의 기업들이 C2PA(콘텐츠 출처 및 진위성 연합)를 결성했으며, ChatGPT와 Gemini 같은 AI 도구들은 이미 C2PA 콘텐츠 인증 정보를 통합했습니다.

하지만 C2PA에도 한계가 있습니다. 이미지와 비디오 분야에서는 매우 효과적이지만, 텍스트 분야는 변조가 너무 쉽기 때문에 한계가 있습니다. 사실 시중에 100% 정확한 AIGC 탐지 도구는 없습니다. 이러한 도구들은 콘텐츠가 AI 스타일을 띠고 있을 확률을 제공할 뿐, 콘텐츠가 AI에 의해 직접 생성되었을 확률을 제공하는 것은 아닙니다.

문제는 AIGC 표절 검사가 정확한 판단을 내리지 못한다는 점이며, 대학에서는 논문이 AIGC 검사를 통과해야 한다는 점도 사실입니다. 따라서 졸업생들이 걱정하는 것도 당연합니다. 학교에서 AIGC 검사 결과만 인정하기 때문에 모두가 표절을 줄일 방법을 찾아야 하지만, AI 기반 표절 검사 도구에 돈을 쓰는 것은 불필요합니다.

문장 구조 왜곡 및 단어 교체를 목표로 하는 유료 AI 기반 중복 제거 도구는 2026년에는 AIGC 탐지에 더 이상 효과적이지 않습니다. 단순히 "important"를 "key"로, "therefore"를 "so"로 바꾸는 것만으로도 탐지될 수 있으며, 의미 재구성만이 효과적입니다. "갑작스러움"을 표현하려면 짧은 문장과 긴 문장을 번갈아 사용하면 글의 리듬을 바꿀 수 있고, 연결어의 사용을 최소화해야 합니다.

더 어려운 "혼란 수준"에 대처하기 위한 숨겨진 비법이 있습니다. 바로 1인칭 시점과 비판적인 표현을 더 많이 사용하는 것입니다. 현재 대규모 AI 모델은 사용자 유지율을 높이기 위해 사용자의 의견에 맞춰 설계되는 경우가 많아 비판적인 표현을 사용하기보다는 사용자의 의견에 동의하는 경향이 있습니다.

동시에, 답변의 객관성을 확보하거나 최소한 사용자에게 객관적이라는 인상을 주기 위해, AI는 사용자와 소통할 때 1인칭 시점을 적극적으로 사용하지 않고, 오히려 보다 객관적인 3인칭 시점을 사용할 것입니다. 이러한 특징들은 '혼란스러움'을 해소하는 데 도움이 됩니다.

[본 기사의 이미지는 인터넷에서 가져온 것입니다.]

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트