喬治·霍茨(George Hotz)——這位17歲時就破解了iPhone,並在索尼起訴他之前對PlayStation 3進行了逆向工程的黑客——週日發表了一篇博客文章,認為大規模採用人工智能編碼代理將以災難告終,或者至少接近災難。
霍茨寫道:“我現在就斷言,將人工智能代理應用於軟件開發將是該領域歷史上代價最慘重的錯誤之一。代理無法編程,而人們卻花了越來越長時間才意識到這一點。”
“輸出結果存在問題,但這種問題越來越難以察覺。這正是我們對一個日益精確的統計模型所預期的。”
這篇題為《 永恆的九月》(The Eternal Sloptember )的文章發表於安德烈·卡帕西(Andrej Karpathy )加入Anthropic公司預訓練團隊五天後。卡帕西是人工智能領域最傑出的研究員之一,他明確表示人工智能代理已經徹底改變了軟件開發。如今,這兩位代表了業界尚未定論的爭論的兩端——而且他們都擁有充分的信譽來表明自己的立場。
霍茨並非旁觀者,而是花了六個月時間在實際項目中運用智能體:包括他開發的開源深度學習框架Tinygrad的部分組件,以及對 USB-PCIe 芯片的完整固件逆向工程。“智能體會預先完成所有工作,”他寫道,然後遞給你一個他稱之為“老虎機拉桿”的東西——你拉動它,然後祈禱剩下的工作能夠順利完成。
它始終無法完全實現。
霍茨預料到了必然的反對意見:程序員將自己的技藝視為身份認同的一部分,自然會抵制那些可能取代自己的工具。他認真對待這種反對意見,並從根本上駁斥了它。
“我更多地想到了維護自我價值感這件事。谷歌的人工智能實驗室(AFL)發現的漏洞比人工智能實驗室(LLM)還多,但沒人對此感到不滿。國際象棋和圍棋比以往任何時候都更受歡迎,”霍茨寫道。從某種意義上說,他的觀點是正確的,國際象棋人工智能已經統治人類幾十年了,而且這項運動也變得越來越受歡迎。
所以,他擔心的不是被取代,而是當所有人都同時使用這些工具時,代碼質量會發生什麼變化,尤其是在大型科技公司和華爾街不斷推動這些工具大規模使用的情況下。
霍茨辯稱:“我幾乎覺得這是一種推銷代理商的心理戰。對損失的恐懼是促使大公司採取行動的少數幾種方法之一。但我認為,正是這種恐懼讓他們犯了一個大錯。”
他的核心論點在於組織結構。高績效團隊擁有足夠緊密的反饋機制,能夠在智能體生成問題之前就發現並解決它們。他們會閱讀代碼,發現錯誤,並判斷何時應該信任這個工具。“低績效團隊則缺乏這種自我檢查機制,”他寫道——而正是這些團隊利用智能體實現了比以往高出十倍的產出。在大公司裡,這種現象會導致一個具體的結果:代碼質量平均水平的快速下降,而這種下降卻被龐大的代碼量所掩蓋。
他認為,最終結果將是“大量劣質產品氾濫成災,而優質產品則黯然失色”。他舉例說,有報道稱蘋果公司正在其整個工程團隊中推廣人工智能編碼工具,然後他簡單地問道:“你認為未來兩年macOS會變得更好還是更糟?”
霍茨現在將自己歸入他所謂的“勒昆/馬庫斯陣營”——這裡指的是Meta公司的首席人工智能科學家揚·勒昆(Yann LeCun)和長期以來對語言模型持懷疑態度的加里·馬庫斯(Gary Marcus)。他們都認為,語言模型本質上是複雜的模式匹配器:它們可以模仿現有代碼的分佈,但無法從根本上解決真正的新問題。
Vibe 編碼——即用簡潔的語言描述需求,然後讓 AI 生成實現方案——在過去一年中發展迅猛,各大人工智能實驗室已將基於代理的編碼定位為旗艦產品。微軟計劃在 2025 年將 GitHub Copilot 轉型為一個完整的代理系統,其 CEO 薩蒂亞·納德拉將其描述為平臺層面的變革,堪比向雲計算的遷移。
對霍茨觀點的反駁並非空穴來風。卡帕西在2025年初還對經紀人持懷疑態度,但在新模式發佈後改變了看法,並於5月19日加入了Anthropic的預備培訓團隊——比霍茨發表文章早五天。他將接下來幾年在前沿領域的工作描述為“意義非凡的成長經歷”。
Anthropic 首席執行官 Dario Amodei 在達沃斯表示,一些 Anthropic 的工程師已經停止編寫代碼,而是讓模型自動處理,自己則負責審核輸出結果。Hotz 則表示,他也嘗試過這樣做,但發現自己每次都不得不手動修改。




