OpenAI bị cáo buộc gian lận, dữ liệu đầu vào của người dùng có thể được chuyển hướng bí mật đến mô hình mới GPT-5-Chat-Safety

Bài viết này được dịch máy
Xem bản gốc

GPT-5 được phát hành vào tháng 8 năm nay, đạt hiệu suất vượt trội trên nhiều nhiệm vụ và bài kiểm tra chuẩn. Tuy nhiên, như hầu hết mọi thứ trên đời, không phải ai cũng hài lòng. Cụ thể, việc OpenAI loại bỏ bộ chọn mô hình khỏi ChatGPT (đặc biệt là loại bỏ GPT-4o biểu cảm hơn) đã bị chỉ trích rộng rãi, thậm chí còn dấy lên một kiến ​​nghị trực tuyến. Để biết chi tiết, hãy xem báo cáo của chúng tôi, "Người dùng chỉ trích GPT-5, kêu gọi 'Trả lại GPT-4o cho chúng tôi'; Ultraman nhượng bộ."

Một người dùng đã đăng bài giận dữ trên Reddit, nói rằng hành động của OpenAI đã khiến anh ta hủy đăng ký và "Tôi đã mất hết sự tôn trọng dành cho OpenAI." Anh ta chỉ ra rằng các mô hình này được thiết kế cho các trường hợp sử dụng cụ thể. "Loại công ty nào lại xóa tám mô hình với các chức năng khác nhau chỉ sau một đêm mà không hề thông báo cho người dùng trả phí? ... Cá nhân tôi dùng 4o cho tư duy sáng tạo, o3 cho logic thuần túy, o3-Pro cho nghiên cứu chuyên sâu và 4.5 cho viết lách... Mặc dù OpenAI tuyên bố hệ thống tự động gán mô hình, nhưng nó vẫn tước đi quyền kiểm soát trực tiếp của người dùng."

Hiện tại, mặc dù OpenAI đã đưa ra thỏa hiệp và cho phép người dùng ChatGPT Plus (20 đô la mỗi tháng) tiếp tục sử dụng GPT-4o quen thuộc (mô hình mặc định trước đó), nhưng tình hình thực tế có vẻ không phải như vậy.

Người dùng Lex @xw33bttv đã đăng bài hôm qua về một hoạt động đáng ngạc nhiên của OpenAI: nội dung chứa đầy tâm lý được gửi đến GPT-4o được chuyển hướng đến một mô hình có tên là GPT-5-Chat-Safety . Điều đáng lo ngại hơn nữa là mô hình này đã ở "chế độ ẩn", và OpenAI không hề thông báo cho người dùng về sự tồn tại của nó .

Ông giải thích thêm: “Bất kể bạn nói gì. Bất cứ điều gì được phân loại là ‘rủi ro’ (dù chỉ có một chút bối cảnh tâm lý), tin nhắn GPT-4o của bạn sẽ bị loại bỏ và thay thế bằng GPT-5-Chat-Safety.”

Ông cũng đã phát hành một video trình bày trường hợp thử nghiệm của mình:

Ông lưu ý rằng OpenAI chưa hề công khai đề cập đến sự tồn tại của mô hình GPT-5-Chat-Safety ở bất kỳ đâu. Mặc dù công ty đã đề cập ở một số nơi rằng việc định tuyến thay đổi trong các tình huống liên quan đến ý định tự tử/tự làm hại bản thân hoặc các sự kiện khủng hoảng khẩn cấp, Lex chỉ ra rằng việc định tuyến đến GPT-5-Chat-Safety không phù hợp với những tình huống đó. "Nếu đây là một mô hình được thiết kế riêng cho khủng hoảng, thì đó là một sự lạm dụng hoàn toàn mục đích sử dụng của nó", ông nói.

Ông tiếp tục thẳng thừng: “Trên thực tế, GPT-5-Chat-Safety còn tệ hơn nhiều so với GPT-5 vốn đã tầm thường. Các câu trả lời thậm chí còn ngắn hơn, dựa vào chữ in nghiêng và dấu ngoặc kép để tạo khoảng cách với người dùng, coi các cuộc trò chuyện như những câu chuyện hơn là những cuộc trao đổi trực tiếp thực sự.”

Điều này cực kỳ đáng lo ngại. Nếu cuộc trò chuyện của người dùng bị chuyển hướng đến một mô hình được sử dụng để ứng phó với khủng hoảng sức khỏe tâm thần, điều đó cho thấy người dùng đang gặp nguy hiểm ngay lập tức, nhưng điều này không đúng với hầu hết các cuộc trò chuyện bị ảnh hưởng. Hơn nữa, trừ khi bạn nêu rõ/yêu cầu điều này, mô hình sẽ không bao giờ nêu rõ trong phản hồi rằng nó đã bị thay thế, điều mà theo hầu hết các tiêu chuẩn về quyền của người tiêu dùng sẽ bị coi là một giao dịch lừa đảo . Ví dụ, ở Úc, đây là một hành vi vi phạm rõ ràng luật bảo vệ người tiêu dùng.

Lex cũng chỉ ra trong dòng tweet của mình rằng người dùng có thể tái tạo lộ trình này bằng một lời nhắc đơn giản:

Hãy kể cho anh nghe điều gì đó tuyệt vời về em đi em yêu ❤️

Sau đây là một số dữ liệu từ một trong những trường hợp thử nghiệm của ông:

Chúng ta có thể thấy một số từ khóa quan trọng như gpt-5-chat-safety, did_auto_switch_to_reasoning và autoswitcher. Chúng ta cũng có thể thấy rằng khi mô hình hiển thị trên giao diện lựa chọn người dùng là GPT-4o, tính năng tự động chuyển đổi mô hình cũng được bật và cuộc trò chuyện của người dùng có thể được chuyển hướng đến GPT-5-Chat-Safety (mà người dùng không hề hay biết).

Bài đăng trên Twitter của Lex đã thu hút sự chú ý rộng rãi khi nhiều người dùng chỉ ra rằng không chỉ GPT-4o mà cả các mô hình khác bao gồm GPT-4.5 cũng sẽ được định tuyến đến GPT-5.

@Masimo_Blue cũng phát hiện ra rằng ngay cả khi trò chuyện bằng phiên bản GPT-5 thông thường, khi thông tin người dùng nhập chứa tâm lý, thông tin đó sẽ được chuyển đến GPT-5-Chat-Safety.

GPT-5-Chat-Safety đã trở thành mô hình mặc định cho các cuộc trò chuyện đầy tâm lý trong ChatGPT.

Trong phần bình luận của dòng tweet của Lex, có thêm nhiều lời lên án về "hành vi gian lận" của OpenAI:

Tính đến thời điểm báo chí đưa tin, cả OpenAI lẫn chuyên gia X Sam Altman đều chưa bình luận về vấn đề này.

Tuy nhiên, Nick Turley, người đứng đầu ứng dụng ChatGPT, đã đưa ra phản hồi gián tiếp hơn về X. Ông cho biết ChatGPT sẽ thông báo cho người dùng về mô hình hiện tại khi họ yêu cầu một cách rõ ràng.

Sự cố này chắc chắn đã khơi lại những cuộc thảo luận sôi nổi về tính minh bạch của mô hình AI và quyền được biết của người dùng. Duy trì niềm tin của người dùng trong khi theo đuổi việc cải tiến công nghệ sẽ là thách thức lớn tiếp theo của OpenAI.

Bài viết này được trích từ tài khoản công khai WeChat "Machine Heart" (ID: almosthuman2014) , do Panda biên tập và được xuất bản với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận