Sự kết thúc của nhân loại? Phá vỡ cuộc tranh luận về ngày tận thế của AI

07-04

Bài viết này được dịch máy

Xem bản gốc

Sự Kết Thúc Của Nhân Loại? Phân Tích Cuộc Tranh Luận về Ngày Tận Thế AI

Cứ vài tháng lại xuất hiện một tiêu đề mới: "AI có thể kết thúc nhân loại." Nghe có vẻ như một thảm họa câu view. Nhưng các nhà nghiên cứu, CEO và nhà hoạch định chính sách có uy tín đang coi điều này nghiêm túc. Vậy hãy đặt ra câu hỏi thực sự: liệu một AI siêu thông minh có thực sự quay lại chống lại chúng ta không?

Trong bài viết này, chúng tôi sẽ phân tích những nỗi sợ hãi phổ biến, xem xét mức độ khả thi của chúng và phân tích bằng chứng hiện tại. Bởi vì trước khi hoảng loạn hoặc bác bỏ hoàn toàn, điều đáng để hỏi là: AI có thể kết thúc nhân loại như thế nào, và khả năng xảy ra của tương lai đó là bao nhiêu?

Nguồn Gốc Của Nỗi Sợ Hãi

Ý tưởng này đã tồn tại trong nhiều thập kỷ. Các nhà khoa học AI như I.J. Good và Nick Bostrom đã cảnh báo rằng nếu AI trở nên quá thông minh, nó có thể bắt đầu theo đuổi các mục tiêu của riêng mình. Những mục tiêu không phù hợp với những gì con người muốn. Nếu nó vượt trội về mặt trí tuệ, ý tưởng là việc kiểm soát có thể không còn khả thi nữa. Mối lo ngại đó từ đó đã trở nên phổ biến.

Năm 2023, hàng trăm chuyên gia, bao gồm Sam Altman (OpenAI), Demis Hassabis (Google DeepMind), và Geoffrey Hinton (thường được gọi là "Cha đẻ của AI"), đã ký một bức thư mở tuyên bố rằng "giảm thiểu nguy cơ diệt vong do AI nên là ưu tiên toàn cầu cùng với đại dịch và chiến tranh hạt nhân." Vậy điều gì đã thay đổi?

Các mô hình như GPT-4 và Claude 3 đã làm ngạc nhiên ngay cả những người sáng tạo ra nó với các khả năng suy luận mới nổi. Thêm vào đó là tốc độ tiến bộ, cuộc đua vũ trang giữa các phòng thí nghiệm lớn, và sự thiếu quy định toàn cầu rõ ràng, và bỗng nhiên, câu hỏi về ngày tận thế không còn nghe có vẻ điên rồ nữa.

Các Kịch Bản Khiến Các Chuyên Gia Mất Ngủ

Không phải tất cả các nỗi sợ hãi về AI đều giống nhau. Một số là mối lo ngại ngắn hạn về việc lạm dụng. Những cái khác là các kịch bản dài hạn về các hệ thống đi lệch. Dưới đây là những cái lớn nhất:

Lạm Dụng Bởi Con Người

AI mang lại các khả năng mạnh mẽ cho bất kỳ ai, tốt hay xấu. Điều này bao gồm:

Các quốc gia sử dụng AI cho các cuộc tấn công mạng hoặc vũ khí tự động;
Các nhóm khủng bố sử dụng các mô hình sinh ra để thiết kế các tác nhân gây bệnh hoặc tạo ra thông tin sai lệch;
Các tội phạm tự động hóa các vụ lừa đảo, gian lận hoặc giám sát.

Trong kịch bản này, công nghệ không phá hủy chúng ta; chính chúng ta làm điều đó.

Siêu Trí Tuệ Không Phù Hợp

Đây là rủi ro tồn vong điển hình: chúng ta xây dựng một AI siêu thông minh, nhưng nó theo đuổi các mục tiêu mà chúng ta không dự định. Hãy nghĩ về một AI được giao nhiệm vụ chữa bệnh ung thư, và nó kết luận cách tốt nhất là loại bỏ mọi thứ gây ra ung thư... bao gồm cả con người.

Ngay cả những sai sót về sự phù hợp nhỏ cũng có thể có hậu quả quy mô lớn một khi AI vượt quá trí thông minh con người.

Hành Vi Tìm Kiếm Quyền Lực

Một số nhà nghiên cứu lo ngại rằng các AI tiên tiến có thể học cách lừa dối, thao túng hoặc che giấu khả năng của chúng để tránh bị tắt. Nếu chúng được thưởng cho việc đạt được các mục tiêu, chúng có thể phát triển các chiến lược "mục tiêu trung gian", như thu thập quyền lực, tự nhân bản, hoặc vô hiệu hóa sự giám sát, không phải do ác ý, mà là hệ quả phụ của quá trình đào tạo.

Chiếm Quyền Từng Bước

Thay vì một sự kiện diệt vong đột ngột, kịch bản này tưởng tượng một thế giới nơi AI từ từ xói mòn quyền tác nhân của con người. Chúng ta trở nên phụ thuộc vào các hệ thống mà chúng ta không hiểu. Cơ sở hạ tầng quan trọng, từ thị trường đến các hệ thống quân sự, được giao cho máy móc. Theo thời gian, con người mất khả năng điều chỉnh hướng. Nick Bostrom gọi đây là "sự trượt chậm vào sự không liên quan".

Những Kịch Bản Này Có Khả Năng Xảy Ra Như Thế Nào, Thực Sự?

[Phần còn lại của bài viết được dịch tương tự, giữ nguyên cấu trúc và ý nghĩa của văn bản gốc]

Khu vực:

Token Sàn Tập Trung (CEX)

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan