17세에 아이폰을 최초로 해킹하고 소니로부터 소송을 당하기 전 플레이스테이션 3를 역설계했던 해커 조지 호츠는 일요일 블로그 게시물을 통해 인공지능 코딩 에이전트의 대량 도입은 재앙, 혹은 적어도 그에 가까운 결과로 이어질 것이라고 주장했습니다.
"지금 예언하건대, 소프트웨어 개발에 AI 에이전트를 도입하는 것은 이 분야 역사상 가장 큰 실수 중 하나가 될 것입니다."라고 호츠는 썼습니다. "에이전트는 프로그래밍을 할 수 없으며, 에이전트가 프로그래밍을 할 수 없다는 사실을 깨닫는 데 점점 더 오랜 시간이 걸리고 있습니다."
"결과에 오류가 있지만, 그 오류를 감지하기가 점점 더 어려워지고 있습니다. 이는 통계 모델의 정확도가 높아짐에 따라 예상할 수 있는 현상입니다."
" 영원한 슬롭템버(The Eternal Sloptember )"라는 제목의 이 글은 인공지능 분야에서 가장 저명한 연구자 중 한 명인 안드레이 카르파티가 인공지능 에이전트가 이미 소프트웨어 개발을 혁신했다는 견해를 명확히 밝히며 앤트로픽의 사전 학습 팀에 합류한 지 5일 만에 나왔습니다. 이제 두 사람은 업계에서 아직 해결되지 않은 논쟁의 양극단을 대표하며, 각자 자신의 입장을 예치(stake) 할 만한 충분한 근거를 가지고 있습니다.
호츠는 단순히 관찰만 하다가 이러한 결론에 도달한 것이 아닙니다. 그는 6개월 동안 실제 프로젝트에서 에이전트를 사용해 보았습니다. 그 프로젝트에는 그의 오픈 소스 딥러닝 프레임워크인 Tinygrad 의 일부와 USB-PCIe 칩의 펌웨어 역설계 전체가 포함되었습니다. 그는 "에이전트는 모든 진행 상황을 미리 처리해 줍니다."라고 설명한 후, 마치 슬롯머신 레버처럼 사용자가 레버를 당기고 마무리 작업이 완료되기를 바라는 방식으로 작동한다고 말합니다.
결코 완전히 그렇지는 않아요.
호츠는 당연한 반발을 예상했다. 프로그래머로서 자신의 기술을 통해 정체성의 일부를 형성하는 사람이 자신을 대체할 수 있는 도구에 저항하는 것은 당연한 일이다. 그는 이러한 반론을 진지하게 받아들이고 그 타당성을 검토하여 기각했다.
"저는 자존감 보존이라는 측면에 대해 더 생각해 봤습니다. 구글의 AFL은 LLM보다 더 많은 버그를 발견했지만 아무도 그것에 대해 그렇게 생각하지 않았죠. 체스와 바둑은 그 어느 때보다 인기가 많습니다."라고 호츠는 썼습니다. 체스 AI가 수십 년 동안 인간을 압도해 왔고, 체스 자체의 인기는 더욱 높아졌다는 점에서 그의 말은 맞습니다.
그러니까 그의 걱정은 대체되는 것에 대한 것이 아닙니다. 모든 사람이 이러한 도구를 동시에 사용할 때, 특히 빅테크 기업과 월스트리트가 이러한 도구의 대량 사용을 끊임없이 부추길 때 코드 품질에 어떤 일이 벌어지는지에 대한 것입니다.
"제 생각엔 이건 에이전트를 팔기 위한 일종의 심리전 같아요."라고 호츠는 주장합니다. "큰 회사를 움직이게 하는 몇 안 되는 방법 중 하나가 손실에 대한 두려움이죠. 하지만 저는 그들이 그런 두려움을 조장하면서 큰 실수를 저지르고 있다고 생각합니다."
그의 핵심 주장은 조직적인 측면에 있습니다. 성과가 뛰어난 조직은 에이전트가 생성하는 문제를 배포 전에 잡아낼 수 있을 만큼 긴밀한 피드백 루프를 갖추고 있습니다. 그들은 코드를 읽고 오류를 발견하며, 도구를 언제 신뢰해야 할지 판단합니다. "성과가 저조한 조직은 이러한 자체 점검 시스템을 갖추고 있지 않습니다."라고 그는 지적합니다. 그리고 바로 그들이 에이전트를 사용하여 이전보다 10배나 많은 양의 코드를 생산하고 있습니다. 대기업에서 이러한 현상은 특정한 결과를 초래합니다. 바로 엄청난 거래량 때문에 가려지지만, 평균 코드 품질의 저하 속도가 훨씬 빨라진다는 것입니다.
그는 이러한 상황이 "엉터리 제품들이 넘쳐나는 황금시대가 되고, 질 좋은 젬(Gems) 들은 암흑시대가 될 것"이라고 주장합니다. 구체적인 예로, 애플이 자사 엔지니어링 조직 전체에 AI 코딩 도구를 도입하고 있다는 보도를 언급하며, "향후 2년 동안 macOS가 더 나아질까요, 아니면 더 나빠질까요?"라고 묻습니다.
호츠는 현재 자신을 "르쿤/마커스 진영"이라고 부르는 입장에 두고 있는데, 이는 메타의 최고 AI 과학자인 얀 르쿤과 오랫동안 언어 모델에 회의적인 입장을 보여온 게리 마커스를 지칭하는 것이다. 두 사람 모두 언어 모델은 근본적으로 정교한 패턴 매칭 도구일 뿐이라고 주장해 왔다. 즉, 기존 코드의 분포를 모방할 수는 있지만, 근본적으로 새로운 문제를 처음부터 추론해낼 수는 없다는 것이다.
바이브 코딩 (원하는 바를 평이한 언어로 설명하고 AI가 구현을 생성하도록 하는 방식)은 지난 1년 동안 폭발적인 인기를 얻었으며, 주요 연구소들은 에이전트 기반 코딩을 주력 제품으로 내세우고 있습니다. 마이크로소프트는 2025년에 GitHub Copilot을 완전한 에이전트 시스템으로 전환했으며 , 사티아 나델라 CEO는 이를 클라우드 도입에 비견할 만한 플랫폼 차원의 변화라고 설명했습니다.
호츠의 입장에 대한 반발은 추상적인 것이 아닙니다. 2025년 초 에이전트에 대해 회의적이었던 카르파티는 새로운 모델이 공개된 후 입장을 바꿔 호츠가 논문을 발표하기 5일 전인 5월 19일에 앤트로픽의 사전 교육팀에 합류했습니다. 그는 앞으로 몇 년간의 연구 활동을 "특히 중요한 성장 과정"이라고 표현했습니다.
앤트로픽 CEO 다리오 아모데이는 다보스에서 일부 엔지니어들이 이미 직접 코드를 작성하는 것을 중단하고 모델이 코드를 처리하도록 맡겨두고 자신은 결과물을 검토하는 방식을 채택했다고 밝혔습니다. 하지만 호츠는 자신도 같은 방식을 시도해 봤지만 매번 수동으로 수정해야 하는 상황에 놓였다고 말했습니다.




