TrungQuốc công ty khởi nghiệp DeepSeek gần đây đã ra mắt mô hình suy luận mã nguồn mở R1, nhanh chóng gây chấn động trong lĩnh vực công nghệ AI. DeepSeek với đặc điểm "chi phí thấp, hiệu suất cao" đã gây ảnh hưởng đến các công ty công nghệ lớn của Mỹ vốn chiếm vị trí thống lĩnh trong lĩnh vực AI, khiến cổ phiếu của các ông lớn AI như Nvidia, OpenAI liên tục lao dốc, thậm chí Tổng thống Mỹ Trump cũng gọi DeepSeek là "hồi chuông cảnh báo ngành công nghiệp AI của Mỹ".
DeepSeek 疑似侵犯 OpenAI 智慧財產權?
Tuy nhiên, theo báo cáo của Financial Times vào ngày hôm nay (29), OpenAI tiết lộ rằng họ đã tìm thấy bằng chứng cho thấy DeepSeek có thể đã sử dụng mô hình độc quyền của OpenAI để huấn luyện sản phẩm của mình, có thể đã vi phạm quyền sở hữu trí tuệ của OpenAI.
OpenAI tiếp tục bổ sung rằng DeepSeek nghi ngờ đã sử dụng một kỹ thuật gọi là "distillation", kỹ thuật này có thể giúp DeepSeek sử dụng mô hình của OpenAI để nâng cao hiệu suất của mình, mà không cần phải tốn chi phí cao để hoàn thành việc huấn luyện mô hình của riêng họ:
Kỹ thuật distillation không phải là điều mới lạ trong ngành, và OpenAI cũng cung cấp cho các nhà phát triển cách hợp pháp để thực hiện loại hoạt động này. Tuy nhiên, vấn đề là nếu bạn sử dụng kỹ thuật này để tạo ra sản phẩm cạnh tranh với OpenAI, thì bản chất sẽ khác.
Ngoài ra, David Sacks, Tổng Giám đốc AI do Tổng thống Mỹ bổ nhiệm, cũng đã đưa ra quan điểm về sự việc này, ông cho rằng DeepSeek có thể đã vi phạm quyền sở hữu trí tuệ.
Microsoft hỗ trợ OpenAI điều tra DeepSeek
Ngoài ra, một nguồn tin thân cận cho biết, Microsoft, một công ty công nghệ lớn của Mỹ, đã cùng với OpenAI vào mùa thu năm ngoái tiến hành điều tra các tài khoản nghi thuộc về DeepSeek, và lúc đó đã phát hiện DeepSeek đã sử dụng API của OpenAI để thực hiện distillation. Sau đó, OpenAI cũng đã chặn tài khoản của DeepSeek do vi phạm điều khoản sử dụng của họ.
Hiện tại, OpenAI đã phát đi tuyên bố rằng họ sẽ áp dụng các biện pháp trừng phạt để bảo vệ quyền sở hữu trí tuệ của mình:
Chúng tôi biết rằng các công ty Trung Quốc và các công ty khác liên tục cố gắng sử dụng kỹ thuật distillation để ăn cắp mô hình của các công ty AI hàng đầu của Mỹ.
Chúng tôi sẽ áp dụng các biện pháp trừng phạt để bảo vệ quyền sở hữu trí tuệ, bao gồm cả việc cẩn thận quyết định nên bao gồm những năng lực tiên tiến nào trong các mô hình được phát hành.
Chúng tôi tin rằng việc hợp tác với chính phủ Mỹ trong tương lai là rất quan trọng, chúng tôi cần bảo vệ những mô hình AI mạnh nhất, không để đối thủ cạnh tranh ăn cắp.
OpenAI gặp khó khăn trong việc bảo vệ quyền?
Tuy nhiên, cần lưu ý rằng do distillation là một phương pháp rất phổ biến trong việc huấn luyện mô hình AI, nên việc cấm hoàn toàn hành vi này cũng sẽ gặp nhiều thách thức. Ví dụ, tiến sĩ AI Ritwik Gupta từ Đại học California đã nói:
Các công ty khởi nghiệp và tổ chức học thuật thường sử dụng các mô hình thương mại hóa lớn như ChatGPT đã được huấn luyện trên dữ liệu được con người căn chỉnh, điều này có nghĩa là bạn có thể thu được kết quả nghiên cứu của các mô hình hàng đầu với chi phí thấp.
Tôi không ngạc nhiên nếu DeepSeek đã sử dụng phương pháp này, và nếu họ thực sự làm như vậy, thì việc hoàn toàn ngăn chặn hành vi này sẽ trở nên rất khó khăn.
Ngoài ra, Financial Times cũng bổ sung rằng OpenAI cũng đang đối mặt với các cáo buộc về vi phạm bản quyền, bao gồm cả các vụ kiện từ The New York Times và nhiều tác giả nổi tiếng, cáo buộc OpenAI đã sử dụng nội dung từ các bài báo và sách mà không được phép.