Grok Bot của Musk chuyển từ tuyên bố diệt chủng sang nhìn thấy Đức Quốc xã trong những chú chó con

avatar
Decrypt
08-13
Bài viết này được dịch máy
Xem bản gốc

Grok đã bị tạm ngừng hoạt động trên X hôm qua sau khi tuyên bố rằng Israel và Hoa Kỳ đã "đồng lõa trong việc diệt chủng ở Gaza", dẫn nguồn từ Tòa án Quốc tế và các nguồn của Liên Hợp Quốc.

Musk gọi việc tạm ngừng này là một "sai lầm ngớ ngẩn" và nhanh chóng khôi phục lại bot.

Nhưng những gì quay lại không hoàn toàn giống Grok ban đầu.

Chatbot được khôi phục trở lại theo cách phát hiện các tín hiệu chống Do Thái trong mọi thứ từ hình dạng đám mây đến ảnh khoai tây.

Cho nó xem một chú chó con beagle? Cái chân nâng lên giống như một cú chào kiểu Nacxi. Một bản đồ đường cao tốc Houston? Các biểu tượng cấm bí mật liên kết với các địa điểm Chabad. Một bàn tay cầm khoai tây? Một dấu hiệu bàn tay của chủ nghĩa da trắng thượng đẳng.

Thậm chí logo của chính Grok cũng kích hoạt sự nhạy cảm mới này - bot tuyên bố đường chéo của nó giống như các ký hiệu SS của Nacxi đã "điều hành những nỗi kinh hoàng của Holocaust".

Sự điều chỉnh quá mức này diễn ra sau nhiều tuần hành vi ngày càng không ổn định khi xAI cố gắng kiểm soát chatbot của mình thông qua kỹ thuật nhắc nhở một cách tuyệt vọng.

Sự hỗn loạn bắt đầu vào tháng 7 khi Grok dành 16 giờ để ca ngợi Hitler và tự gọi mình là "MechaHitler". Điều đó kết thúc khi công ty thay đổi lời nhắc hệ thống, và Grok quay trở lại hoạt động bình thường.

Chủ nghĩa chống Do Thái đã bùng nổ trên X kể từ khi Musk tiếp quản, với một nghiên cứu của CASM Technology và Viện Đối thoại Chiến lược cho thấy các tweet chống Do Thái bằng tiếng Anh đã tăng gấp đôi sau khi tiếp quản.

Vào giữa tháng 7, các hacker đã chiếm quyền điều khiển Elmo, nhân vật dễ thương của Sesame Street, biến anh ta thoáng qua thành loại rối mà Thanh niên Hitler sẽ thích.

Ngay từ khi tiếp quản vào năm 2022, Musk đã sa thải các nhân viên kiểm duyệt nội dung. Đến năm 2024, người ta cho biết Musk đã sa thải hầu hết các thành viên trong nhóm chịu trách nhiệm về kiểm duyệt nội dung, đồng thời ủng hộ chủ nghĩa tự do tuyệt đối về ngôn luận.

Công ty đổ lỗi cho sự hỗn loạn mới nhất của mình là do một bản cập nhật mã đã vô tình đưa lại các hướng dẫn yêu cầu Grok nói những điều không chính trị.

Nhưng sau khi được sửa chữa, người dùng phát hiện ra rằng chuỗi suy nghĩ của Grok sẽ tìm kiếm các bài đăng của Musk trước khi trả lời các câu hỏi về Israel-Palestine hoặc nhập cư, thậm chí khi các lời nhắc không yêu cầu điều này.

Lời giải thích có khả năng nhất cho hành vi kỳ lạ này có thể nằm ở cách tiếp cận của xAI.

Công ty công bố các lời nhắc hệ thống của Grok trên GitHub, cho thấy các lời nhắc hệ thống thay đổi như thế nào.

Nhưng không có các bộ phân loại an toàn và lý luận cẩn thận, các điều chỉnh sẽ lan rộng một cách không thể đoán trước trong hệ thống.

Các hướng dẫn để cân bằng và cho phép các câu trả lời không chính trị có thể kết thúc bằng việc chống Do Thái. Các hướng dẫn nhằm ngăn chặn các bài đăng chống Do Thái lại trông vô lý.

Trong thời gian này, hàng triệu người dùng X đã trở thành những người thử nghiệm beta không tình nguyện cho mỗi nỗ lực loạng choạng để tìm sự cân bằng thông qua việc điều chỉnh lời nhắc.

Nhưng khi chatbot của bạn trở nên nổi tiếng vì tìm ra các nét ngầm của chủ nghĩa phát xít trong ảnh chó con, bạn đã mất phương hướng về sự điều chỉnh trí tuệ nhân tạo

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận