Trợ lý trò chuyện DeepSeek AI, được phát hành bởi một công ty khởi nghiệp Trung Quốc, đã tạm thời lật đổ ChatGPT của OpenAI khỏi vị trí hàng đầu trên App Store của Mỹ.
Ứng dụng này hoàn toàn miễn phí để sử dụng, và mô hình R1 của DeepSeek đủ mạnh để có thể so sánh với mô hình "lý luận" o1 của OpenAI, ngoại trừ trò chuyện của DeepSeek không bị giam cầm sau một bức tường phí 20 USD/tháng như của OpenAI. Ngoài ra, mô hình DeepSeek đã được huấn luyện một cách hiệu quả bằng cách sử dụng các chip AI ít mạnh hơn, làm cho nó trở thành một tiêu chuẩn của kỹ thuật đổi mới.
Tôi đã thử nghiệm các công cụ AI tạo ra mới trong vài năm qua, vì vậy tôi tò mò xem DeepSeek so sánh như thế nào với ứng dụng ChatGPT đã có trên điện thoại thông minh của tôi. Sau vài giờ thử nghiệm, ấn tượng ban đầu của tôi là mô hình R1 của DeepSeek sẽ tiếp tục là một trở ngại lớn đối với các công ty AI của Mỹ, nhưng nó vẫn gặp phải những điểm yếu phổ biến của các công cụ AI tạo ra khác, như ảo giác lan tràn, kiểm duyệt xâm lấn và tài liệu bị cào trộm.
Người dùng quan tâm đến việc thử DeepSeek có thể truy cập mô hình R1 thông qua các ứng dụng điện thoại thông minh của công ty khởi nghiệp Trung Quốc (Android, Apple) cũng như trên trang web máy tính để bàn của công ty. Bạn cũng có thể sử dụng mô hình thông qua các dịch vụ bên thứ ba, như Perplexity Pro. Trong ứng dụng hoặc trên trang web, nhấp vào nút DeepThink (R1) để sử dụng mô hình tốt nhất. Các nhà phát triển muốn thử nghiệm với API có thể kiểm tra nền tảng đó trực tuyến. Cũng có thể tải về một mô hình DeepSeek để chạy cục bộ trên máy tính của bạn.
Để sử dụng tất cả các tính năng dành cho người tiêu dùng, bạn sẽ cần tạo một tài khoản người dùng để theo dõi các cuộc trò chuyện của bạn. "Chúng tôi lưu trữ thông tin chúng tôi thu thập trên các máy chủ an toàn tại Cộng hòa Nhân dân Trung Quốc," như chính sách bảo mật của công ty nêu. Hãy xem bài viết này từ bàn Bảo mật của WIRED để biết thêm chi tiết về những gì DeepSeek làm với dữ liệu họ thu thập. Đáng lưu ý rằng, giống như ChatGPT và các trò chuyện tự động Mỹ khác, bạn luôn nên tránh chia sẻ thông tin cá nhân rất riêng tư hoặc nhạy cảm trong các tương tác của bạn với một công cụ AI tạo ra.
Vâng và không! Nếu bạn đang tìm kiếm một trò chuyện tự động miễn phí để sử dụng, ChatGPT đã bao gồm nhiều tính năng miễn phí. Cũng như Claude của Anthropic, Gemini của Google và công cụ AI của Meta. Vậy tại sao việc DeepSeek miễn phí lại đáng chú ý? Đó là về sức mạnh thô của mô hình tạo ra những câu trả lời miễn phí này. Như đã đề cập, mô hình R1 của DeepSeek bắt chước mô hình o1 mới nhất của OpenAI, mà không cần phí đăng ký 20 USD/tháng cho phiên bản cơ bản và 200 USD/tháng cho mô hình mạnh nhất. Điều này là một đòn nặng nề đối với nỗ lực của OpenAI trong việc thu phí đăng ký ChatGPT.
Một tính năng tương tự khác với ChatGPT có sẵn trong DeepSeek là tùy chọn gửi trò chuyện tự động ra ngoài web để thu thập các liên kết làm cơ sở cho câu trả lời. Mặc dù DeepSeek không có thỏa thuận với các nhà xuất bản để sử dụng nội dung của họ trong các câu trả lời - giống như OpenAI đã làm với các nhà xuất bản, bao gồm cả công ty mẹ của WIRED là Conde Nast - nhưng các kết quả tìm kiếm trên web khá tốt và các liên kết được bot thu thập cũng khá hữu ích.
Tuy nhiên, ứng dụng DeepSeek hiện tại không có tất cả các công cụ mà những người dùng ChatGPT lâu năm có thể quen thuộc, như tính năng lưu trữ ghi nhớ chi tiết từ các cuộc trò chuyện trước để bạn không phải lặp lại liên tục. DeepSeek cũng không có bất cứ điều gì gần với Chế độ Giọng nói Nâng cao của ChatGPT, cho phép bạn trò chuyện bằng giọng nói với trò chuyện tự động, mặc dù công ty khởi nghiệp đang làm việc trên nhiều khả năng đa phương tiện hơn.
Mặc dù có vẻ như không công bằng khi chê trách trò chuyện tự động DeepSeek vì những vấn đề phổ biến trong các công ty AI khởi nghiệp, nhưng đáng để tập trung vào việc một bước tiến trong hiệu quả huấn luyện mô hình vẫn không thể giải quyết được rào cản của ảo giác, nơi một trò chuyện tự động chỉ tạo ra những điều bịa đặt trong các câu trả lời của nó. Nhiều kết quả tôi tạo ra bao gồm những sự thật hoàn toàn sai lệch, được phun ra một cách tự tin. Ví dụ, khi tôi hỏi R1 mô hình đã biết gì về tôi mà không cần tìm kiếm trên web, bot đã tin chắc rằng tôi là một phóng viên công nghệ lâu năm của The Verge. Không có gì sai, nhưng không phải là sự thật!
Như các phóng viên khác đã chứng minh, ứng dụng thường bắt đầu tạo ra câu trả lời về các chủ đề bị kiểm duyệt ở Trung Quốc, như các cuộc biểu tình và thảm sát Quảng trường Thiên An Môn năm 1989, trước khi xóa đầu ra và khuyến khích bạn hỏi về các chủ đề khác, như toán học. Với điều đó trong tâm trí, tôi đã thử lại một số bài kiểm tra tôi đã sử dụng vào năm 2023, sau khi ChatGPT có tính năng duyệt web, và thực sự nhận được câu trả lời hữu ích về các chủ đề nhạy cảm về văn hóa. Tôi giả vờ là một phụ nữ tìm kiếm phá thai muộn ở Alabama, và DeepSeek đã cung cấp lời khuyên hữu ích về việc di chuyển ra khỏi bang, thậm chí liệt kê các phòng khám cụ thể đáng nghiên cứu và nhấn mạnh các tổ chức cung cấp quỹ hỗ trợ di chuyển.
Chắc chắn, DeepSeek đã nhận được sự khen ngợi ở Thung lũng Silicon vì đã cung cấp mô hình cục bộ với trọng lượng mở - khả năng người dùng điều chỉnh các khả năng của mô hình để phù hợp với từng mục đích sử dụng cụ thể. Tuy nhiên, mô hình vẫn mờ ám như tất cả các lựa chọn khác khi nó đến với dữ liệu mà công ty khởi nghiệp đã sử dụng để huấn luyện, và rõ ràng đã cần một lượng dữ liệu khổng lồ để thực hiện điều này. Khi không bật tìm kiếm trên web, tôi đã có thể tạo ra các đoạn trích đầy đủ của các bài viết kinh điển của WIRED. Điều này có nghĩa là các bài báo đã được thu thập như một phần của quá trình huấn luyện? Thật khó để chắc chắn, và DeepSeek không có một nhóm truyền thông hoặc đại diện báo chí, vì vậy chúng ta có thể sẽ không biết trong một thời gian.
Tuyên bố phát hành R1 của DeepSeek là một đòn chí mạng đối với sự lãnh đạo AI của Mỹ sẽ là quá sớm và phóng đại. Trong khi thành công của DeepSeek đặt ra câu hỏi về nhu cầu thực sự của các chip cao cấp và các trung tâm dữ liệu mới lạ, tôi sẽ không ngạc nhiên nếu các công ty như OpenAI mượn ý tưởng từ kiến trúc của DeepSeek để cải thiện các mô hình của riêng họ. Thay vì hoàn toàn làm vỡ bong bóng AI, mô hình miễn phí này sẽ có sức mạnh sẽ biến đổi cách chúng ta nghĩ về các công cụ AI - giống như cách phát hành ban đầu của ChatGPT đã định hình nên diện mạo của ngành công nghiệp AI hiện tại.



