Một hacker nổi tiếng của iPhone và Sony cho rằng các tác nhân lập trình AI là một thảm họa tiềm tàng.

Bài viết này được dịch máy

Xem bản gốc

George Hotz - hacker đầu tiên bẻ khóa iPhone ở tuổi 17 và đảo ngược kỹ thuật PlayStation 3 trước khi Sony kiện anh ta - đã đăng một bài viết trên blog hôm Chủ nhật, lập luận rằng việc áp dụng rộng rãi các tác nhân lập trình AI sẽ dẫn đến thảm họa, hoặc ít nhất là gần như vậy.

“Tôi khẳng định ngay bây giờ, việc ứng dụng các tác nhân AI vào phát triển phần mềm sẽ là một trong những sai lầm tốn kém nhất trong lịch sử lĩnh vực này,” Hotz viết. “Các tác nhân không thể lập trình, và người ta ngày càng mất nhiều thời gian hơn để nhận ra điều đó.”

“Kết quả đầu ra bị lỗi, nhưng theo cách ngày càng khó phát hiện. Điều này hoàn toàn phù hợp với một mô hình thống kê ngày càng chính xác.”

Bài đăng, có tiêu đề " Tháng Chín Lười Biếng Vĩnh Cửu", xuất hiện năm ngày sau khi Andrej Karpathy, một trong những nhà nghiên cứu AI nổi bật nhất, gia nhập nhóm tiền huấn luyện của Anthropic với quan điểm rõ ràng rằng các tác nhân AI đã làm thay đổi quá trình phát triển phần mềm. Hai người đàn ông này hiện đại diện cho hai cực đối lập của một cuộc tranh luận mà ngành công nghiệp vẫn chưa ngã ngũ—và cả hai đều có uy tín thực sự để Stake lập trường của mình.

Hotz không đưa ra kết luận của mình chỉ từ bên ngoài cuộc. Ông đã dành sáu tháng sử dụng các tác nhân trong các dự án thực tế: một phần của Tinygrad , khung phần mềm học sâu mã nguồn mở của ông, và toàn bộ quá trình đảo ngược kỹ thuật phần mềm nhúng của một chip USB-PCIe. "Tác nhân đẩy nhanh tất cả tiến độ," ông viết, rồi đưa cho bạn thứ mà ông mô tả như một cần gạt máy đánh bạc—bạn kéo nó và hy vọng công việc hoàn thiện sẽ được thực hiện.

Nó không bao giờ thực sự như vậy.

Hotz lường trước được sự phản đối hiển nhiên: một lập trình viên coi nghề nghiệp là một phần bản sắc của mình thì đương nhiên sẽ phản đối những công cụ đe dọa thay thế anh ta. Anh ấy xem xét nghiêm túc sự phản đối và bác bỏ nó dựa trên lý lẽ xác đáng.

“Tôi nghĩ nhiều hơn về việc bảo vệ lòng tự trọng. AFL của Google tìm ra nhiều lỗi hơn LLM và chẳng ai cảm thấy như vậy cả. Cờ vua và cờ vây ngày càng phổ biến hơn bao giờ hết,” Hotz viết. Và ông ấy đúng ở chỗ trí tuệ nhân tạo chơi cờ vua đã thống trị con người trong nhiều thập kỷ và trò chơi này ngày càng trở nên phổ biến hơn.

Vì vậy, mối lo ngại của ông ấy không phải là việc bị thay thế. Mà là điều gì sẽ xảy ra với chất lượng mã nguồn khi mọi người cùng sử dụng những công cụ này một lúc, đặc biệt là khi các tập đoàn công nghệ lớn và Phố Wall liên tục thúc đẩy việc sử dụng rộng rãi các công cụ này.

“Tôi gần như nghĩ đây là một kiểu chiến dịch tâm lý để bán các đại lý,” Hotz lập luận. “Nỗi sợ mất mát là một trong những cách duy nhất để khiến các công ty lớn hành động. Mặc dù tôi nghĩ rằng trong nỗi sợ hãi đó, họ đang mắc một sai lầm lớn.”

Luận điểm chính của ông ấy nằm ở khía cạnh tổ chức. Những người làm việc hiệu quả cao có vòng phản hồi đủ chặt chẽ để phát hiện các vấn đề do công cụ tự động tạo ra trước khi chúng được đưa vào sử dụng. Họ đọc mã, phát hiện lỗi và điều chỉnh thời điểm nên tin tưởng công cụ. "Những người làm việc kém hiệu quả hơn sẽ không có khả năng tự kiểm tra đó," ông viết – và chính họ là những người sử dụng công cụ tự động để tạo ra năng suất gấp 10 lần so với trước đây. Tại một công ty lớn, phép tính đó dẫn đến một kết quả cụ thể: chất lượng mã trung bình giảm sút nhanh hơn, bị che giấu bởi khối lượng giao dịch công việc khổng lồ.

Ông lập luận rằng kết quả sẽ là "một kỷ nguyên vàng cho vô số sản phẩm kém chất lượng, và một thời kỳ đen tối cho Gems chất lượng cao." Để minh họa cụ thể, ông chỉ ra các báo cáo cho rằng Apple đang thúc đẩy việc sử dụng các công cụ lập trình AI trong toàn bộ bộ phận kỹ thuật của mình, rồi hỏi đơn giản: "Bạn nghĩ macOS sẽ tốt hơn hay tệ hơn trong 2 năm tới?"

Hotz hiện tự xếp mình vào nhóm mà ông gọi là "phe LeCun/Marcus"—ám chỉ Yann LeCun, nhà khoa học AI trưởng của Meta, và Gary Marcus, một người hoài nghi lâu năm về mô hình ngôn ngữ (LLM). Cả hai đều lập luận rằng các mô hình ngôn ngữ về cơ bản là những bộ so khớp mẫu tinh vi: Chúng có thể bắt chước sự phân bố của mã hiện có, nhưng không thể suy luận ra các vấn đề thực sự mới từ các nguyên tắc cơ bản.

Lập trình dựa trên cảm nhận — mô tả những gì bạn muốn bằng ngôn ngữ đơn giản và để AI tạo ra quá trình triển khai — đã bùng nổ trong năm qua, và các phòng thí nghiệm lớn đã định vị lập trình dựa trên tác nhân như một sản phẩm chủ lực. Microsoft đã chuyển đổi GitHub Copilot thành một hệ thống tác nhân hoàn chỉnh vào năm 2025, với CEO Satya Nadella mô tả đó là một sự thay đổi ở cấp độ nền tảng tương đương với việc chuyển sang điện toán đám mây.

Sự phản đối đối với quan điểm của Hotz không phải là trừu tượng. Karpathy, người từng hoài nghi về các đặc vụ vào đầu năm 2025, đã thay đổi quan điểm sau khi các mô hình mới được phát hành và gia nhập nhóm tiền đào tạo của Anthropic vào ngày 19 tháng 5 — năm ngày trước khi Hotz công bố. Ông mô tả vài năm tiếp theo ở lĩnh vực tiên phong này là "đặc biệt mang tính định hình".

CEO của Anthropic, Dario Amodei, phát biểu tại Davos rằng một số kỹ sư của Anthropic đã ngừng tự viết mã, để các mô hình xử lý việc đó trong khi họ xem xét kết quả. Về phần mình, Hotz cho biết ông đã thử làm điều tương tự và nhận thấy mình luôn phải tự sửa lỗi thủ công.

Khu vực:

Play To Earn

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan