Nền tảng truyền thông xã hội Reddit đã khởi kiện công ty AI Anthropic vào ngày 4 tháng 6, cáo buộc "thu thập dữ liệu của nền tảng một cách trái phép để đào tạo mô hình AI Claude" của mình, vi phạm thỏa thuận người dùng của Reddit và thực hiện "các hoạt động kinh doanh bất hợp pháp và không công bằng".
Động thái này đã kích thích giá cổ phiếu của Reddit tăng 6,63% trong ngày, đóng cửa ở mức 118,21 đô la Mỹ.
Các cáo buộc chính và truy cập dữ liệu
Theo tài liệu khởi kiện, từ tháng 7 năm 2024, Anthropic đã cố gắng truy cập dữ liệu của Reddit hơn 100.000 lần mà không được ủy quyền. Reddit chỉ ra rằng ngay cả khi được yêu cầu dừng lại, các hành vi như vậy vẫn tiếp tục. Giám đốc pháp lý của Reddit, Ben Lee, trong tuyên bố của mình nhấn mạnh:
„Chúng tôi tin vào một mạng internet mở, nhưng điều đó không đồng nghĩa với việc khai thác thương mại. Chúng tôi sẽ không chấp nhận các thực thể theo đuổi lợi nhuận như Anthropic khai thác nội dung của Reddit để kiếm hàng tỷ đô la mà không đền đáp lại người dùng Reddit hoặc tôn trọng quyền riêng tư của họ."
Trọng tâm của vụ kiện không phải là vi phạm bản quyền, mà tập trung vào các cáo buộc về vi phạm hợp đồng (thỏa thuận người dùng), xâm phạm tài sản, lợi dụng bất chính, can thiệp trái phép và cạnh tranh không lành mạnh. Do đó, Reddit đang tìm kiếm các khoản bồi thường thiệt hại, yêu cầu Anthropic hoàn trả lợi nhuận thu được từ việc sử dụng dữ liệu của mình và yêu cầu tòa án ban hành lệnh cấm ngăn chặn việc sử dụng nội dung của nền tảng mà không được ủy quyền.
Phản hồi của Anthropic
Trước đó, Reddit đã đạt được các thỏa thuận cấp phép dữ liệu AI với các đối thủ chính của Anthropic, như OpenAI và công ty mẹ Alphabet của Google. Các thỏa thuận này quy định rõ các đối tác phải tôn trọng quyền riêng tư của người dùng, hỗ trợ các yêu cầu xóa nội dung và cung cấp "bồi thường" cho Reddit về chi phí truy cập dữ liệu và cơ sở hạ tầng.
Về vụ việc này, người phát ngôn của Anthropic cho biết „không đồng ý với các cáo buộc của Reddit và sẽ tích cực chuẩn bị biện hộ pháp lý".
Anthropic được thành lập bởi các nhà nghiên cứu trước đây của OpenAI, từ đầu đã tuyên bố chú trọng hơn đến an toàn và trách nhiệm AI so với các đối thủ cạnh tranh, nhưng Reddit trong đơn kiện đã chỉ trích rằng lời nói không đi đôi với hành động, bỏ qua các quy tắc của nền tảng và quyền riêng tư của người dùng.
Nội dung là "đòi tiền"
Vụ kiện này phản ánh sự phản kháng phổ biến của các nền tảng nội dung chống lại việc các công ty AI sử dụng trình thu thập để trích xuất nội dung, bao gồm vụ kiện của New York Times chống lại OpenAI và Microsoft, cũng như các hành động pháp lý tương tự của nhiều nhà xuất bản âm nhạc chống lại các công ty âm thanh AI (Anthropic cũng nằm trong số đó).
Reddit, với 20 năm lịch sử và chứa đựng nhiều cuộc thảo luận chủ đề, chắc chắn là một nguồn dữ liệu quan trọng để đào tạo các mô hình AI. Thu thập dữ liệu mà không xin phép rõ ràng là để lưu lại bằng chứng và yêu cầu bồi thường sau này, đây là sự nhận thức về giá trị thương mại của dữ liệu trong thời đại AI.






