저자: 심심

대규모 모델이 추진하는 AI 도구가 일상생활에 들어오면서, 가장 큰 관심은 아마도 사무실의 '소모품' 직원들이 아니라 학교의 학생들일 것입니다. 왜냐하면 ChatGPT로 작문이나 짧은 논문을 생성하는 것이 너무나 쉽기 때문입니다.
이로 인해, 대규모 모델이 탄생한 후 많은 교사들의 가장 빠른 반응은 'AI 금지' 또는 부정행위 규범을 다시 정의하는 것이었습니다.
하지만 일부 사람들은 곧 깨달았습니다: 진정한 위험은 부정행위가 아니라, 학생들이 대뇌의 '학습 과정' 자체를 AI에게 전면적으로 외주를 주고 있다는 것입니다.
보기에는 과제가 더 쉬워졌고 성적도 올라갔습니다. 하지만 동시에 불안한 문제도 나타났습니다: 학생들이 점점 더 AI에 의존해 글쓰기, 문제 풀이, 요약, 사고를 할 때, 그들은 정말로 '학습'하고 있는 걸까요?
아니면, AI 시대에 학생들은 여전히 '학습'해야 할까요?
01 배운 것처럼 보이지만, 실제로는 배우지 않았다
2022년 말 ChatGPT를 출시한 이후, OpenAI는 아마도 그들의 가장 충실한 사용자들이 학생들임을 인정해야 할 것입니다.
지난 2년을 돌아보면, 미디어에서는 한때 OpenAI의 사용자 증가가 정체되었다고 보도했지만, 9월만 되면 사용자 수가 대폭 증가했습니다. 그 변동의 이유는 간단합니다 - 학생들이 개학했고, 방학이 끝났기 때문입니다.
AI가 교육을 변화시킨 첫 번째 행동은 '과제 완수'를 비정상적으로 쉽게 만든 것입니다. 모르면 AI에게 물어보면 됩니다.
한 조사에 따르면, 2024년 말까지 약 70%의 미국 청소년이 생성형 인공지능 도구를 사용해 보았으며, 절반 이상의 청소년이 AI를 사용해 가정 과제를 도와받았습니다.
국내에서도 많은 조사가 AI의 학교 내 사용 보편성을 보여줍니다. DeepSeek가 탄생하기 전에, 학생들은 문심일언, 두부 등 국내 AI 도구를 직접 사용했습니다.
논문 작성, 독서 보고서, 수학 문제 풀이 등에서 학생들의 과제 완성도가 점점 더 좋아 보이지만, 문제는 - 그들이 정말로 배웠는가? 입니다.
펜실베이니아 대학 연구팀이 2024년에 실제 실험을 진행했습니다:
고등학생들을 세 그룹으로 나누어 수학을 배울 때, 한 그룹은 GPT-4 기반 AI 챗봇을 자유롭게 사용하고, 다른 그룹은 'GPT 튜터'(답을 주지 않고 안내만 제공)를 사용하며, 나머지 그룹은 AI를 사용하지 않았습니다.
결과, 연습 단계에서는 AI를 자유롭게 사용한 그룹의 성과가 가장 우수했고, 거의 압도적이었습니다.
하지만 최종 시험에서 AI 사용이 금지되자, AI 그룹의 평균 점수는 AI를 전혀 사용하지 않은 그룹보다 17% 낮았습니다.
'GPT 튜터'를 사용한 학생들은 연습 단계에서 성과가 127% 높았지만, 최종 시험 성적은 AI를 사용하지 않은 그룹과 거의 비슷했습니다.

이미지 출처: 펜실베이니아 대학 연구팀 논문 결과
펜실베이니아 대학 연구원들은 이로부터 제한 없는 인공지능이 이미 '지팡이'가 되었다고 결론지었습니다: 학생들은 연습 기간 동안 챗봇에 의존해 힘든 작업을 완수하고, '기본 수학 개념을 충분히 깊이 학습하지 못했으며', 유사한 문제를 스스로 해결할 수 없습니다.
그들은 AI가 학생들이 과제를 할 때 일부 지원을 제공하여 지식을 습득했다는 착각을 불러일으키지만, 결국 시험에서 그들의 부족함이 드러난다고 봅니다. AI라는 '지팡이'가 있지만, 다리는 점점 더 약해집니다.
이것이 교육의 'AI 역설'입니다:
AI는 당신을 더 똑똑해 보이게 하지만, 실제로는 더 적게 배울 수 있습니다.

이미지 출처: 펜실베이니아 대학 연구팀 논문
(번역은 계속됩니다. 전체 텍스트를 번역하겠습니다.)교육은 정확히 세 번째 상황에 해당합니다. Nicholas Carr는 학생들 자체가 새로운 기술을 배우는 과정에 있으며 아직 이러한 기술을 습득하지 못했다고 주장합니다. 학생이 경험을 얻기 전에 AI가 수학 문제 해결이든 논문 작성이든 작업을 '접수'하면 실제 기술 성장이 방해받을 수 있습니다.

이미지 출처: substack
더 나아가, 한 사람이 거의 '스스로 생각하지 않으면' AI 대화 창에 좋은 프롬프트를 작성하기조차 어려울 수 있습니다. AI 출력을 검증하고 개선하는 것은 말할 것도 없고, 이러한 메타 기술은 사용자의 주제에 대한 잠재적 이해에 달려 있습니다.
스워스모어 대학 역사학 교수 Timothy Burke는 "현재와 가까운 미래의 AI 생성 도구를 연구와 표현에 진정으로 활용하려면 당신 스스로 많은 것을 알아야 합니다"라고 글을 썼습니다.
"마치 무엇을 찾아야 할지, 카드 목록이 무엇인지 모른다면 그것을 사용해 자료를 찾을 수 없듯이, 구글 검색을 최대한 활용하려면 키워드를 어떻게 수정하고, 검색 범위를 좁히고, 이전 검색 결과에서 유용한 내용을 선별해 다음 검색을 최적화할 수 있어야 합니다."
교육은 바로 이러한 영역입니다. 초등학생이 막 읽기를 시작할 때 AI가 독후감을 대신 쓸 수 있고, 중학생이 논증을 처음 접할 때 AI가 구조적으로 뛰어난 논설문을 한 번에 생성할 수 있으며, 대학생이 연구를 시작할 때 AI가 자동으로 개요, 분석, 요약, 인용을 제공할 수 있습니다.
이러한 기술들은 아직 습득하기도 전에 이미 대체되고 있습니다. 그 결과 학생들은 단순히 "어떻게 해야 하는지 잊어버린" 것이 아니라 "어떻게 해야 하는지 배운 적 조차 없게" 되었고, 때로는 복사한 내용이 AI가 만들어낸 '환각'임을 인식하지 못하기도 합니다.
AI 코딩의 경우도 마찬가지입니다. 학생들이 실제로 프로그래밍을 배우는 대신 항상 AI에게 코드 작성을 맡기면, AI 출력에 오류가 있을 때 이를 디버깅하거나 개선할 충분한 프로그래밍 지식이 없을 수 있습니다.
Nicholas Carr는 이를 자동 조종 장치만 아는 한 세대의 조종사에 비유했습니다. 그들은 일반 비행을 할 수 있지만 수동 제어가 필요한 긴급 상황에서는 무력해집니다.
"우리는 학생들이 어떻게 인공지능으로 부정행위를 하는지에 주목해왔습니다. 우리가 더 주목해야 할 것은 인공지능이 학생들을 어떻게 배신하는가입니다."라고 Nicholas Carr는 말했습니다.
"생성형 인공지능으로 원래 B 수준이던 학생이 A 등급 작품을 쓸 수 있지만, 동시에 C 수준의 학생이 될 수 있습니다."

