Nguồn tin nội bộ cho biết DeepSeek V4 sẽ đánh bại Claude và ChatGPT về khả năng lập trình và sẽ ra mắt trong vòng vài tuần tới.

01-10

Bài viết này được dịch máy

Xem bản gốc

Theo các nguồn tin, DeepSeek dự định tung ra mẫu V4 vào khoảng giữa tháng Hai, và nếu các thử nghiệm nội bộ là chính xác, thì các ông lớn về trí tuệ nhân tạo ở Thung lũng Silicon nên lo lắng.

Theo trang The Information , công ty khởi nghiệp AI có trụ sở tại Hàng Châu này có thể đang nhắm đến việc ra mắt sản phẩm vào khoảng ngày 17 tháng 2 – Tết Nguyên đán – với một mô hình được thiết kế đặc biệt cho các tác vụ lập trình. Những người nắm rõ dự án cho biết V4 vượt trội hơn cả Claude của Anthropic và dòng GPT của OpenAI trong các bài kiểm tra nội bộ, đặc biệt là khi xử lý các đoạn mã rất dài.

Tất nhiên, chưa có bất kỳ tiêu chuẩn hay thông tin nào về mô hình được công khai, vì vậy không thể trực tiếp xác minh những tuyên bố như vậy. DeepSeek cũng chưa xác nhận những tin đồn này.

Tuy nhiên, cộng đồng nhà phát triển không chờ đợi thông báo chính thức. Các diễn đàn r/DeepSeek và r/LocalLLaMA trên Reddit đã bắt đầu sôi nổi, người dùng đang tích trữ tín dụng API, và những người đam mê trên X đã nhanh chóng chia sẻ dự đoán của họ rằng V4 có thể củng cố vị thế của DeepSeek như một kẻ yếu thế kiên cường, không chịu tuân theo những quy tắc tỷ đô của Thung lũng Silicon.

Đây sẽ không phải là sự đột phá đầu tiên của DeepSeek. Khi công ty này phát hành mô hình suy luận R1 vào tháng 1 năm 2025, nó đã gây ra một đợt bán tháo trị giá 1 nghìn tỷ đô la trên thị trường toàn cầu.

Lý do là gì? Mô hình R1 của DeepSeek đã đạt được hiệu năng tương đương với mô hình o1 của OpenAI trong các bài kiểm tra toán học và suy luận, mặc dù chi phí phát triển được cho là chỉ khoảng 6 triệu đô la – rẻ hơn khoảng 68 lần so với các đối thủ cạnh tranh. Mô hình V3 của nó sau đó đạt 90,2% trên bài kiểm tra MATH-500, vượt xa mức 78,3% của Claude và bản cập nhật gần đây “ V3.2 Speciale ” đã cải thiện hiệu năng của nó hơn nữa.

Việc tập trung vào lập trình của V4 sẽ là một bước ngoặt chiến lược. Trong khi R1 nhấn mạnh vào lý luận thuần túy—logic, toán học, chứng minh hình thức—V4 là một mô hình lai (bao gồm cả các nhiệm vụ lý luận và phi lý luận) nhắm đến thị trường nhà phát triển doanh nghiệp, nơi việc tạo ra mã có độ chính xác cao sẽ trực tiếp chuyển thành doanh thu.

Để khẳng định vị thế thống trị, V4 cần phải đánh bại Claude Opus 4.5, hiện đang giữ kỷ lục về số lần được xác minh trên SWE-bench với 80,9%. Nhưng nếu nhìn vào những lần ra mắt trước đây của DeepSeek, thì điều này có thể không phải là không thể đạt được ngay cả khi phải đối mặt với nhiều hạn chế mà một phòng thí nghiệm AI của Trung Quốc phải đối mặt.

Nếu những tin đồn là sự thật, thì phòng thí nghiệm nhỏ này làm thế nào có thể đạt được thành tựu như vậy?

Vũ khí bí mật của công ty có thể nằm trong bài nghiên cứu được công bố ngày 1 tháng 1: Kết nối siêu liên kết bị ràng buộc bởi đa tạp (Manifold-Constrained Hyper-Connections), hay mHC. Được đồng tác giả bởi người sáng lập Liang Wenfeng, phương pháp huấn luyện mới này giải quyết một vấn đề cơ bản trong việc mở rộng quy mô các mô hình ngôn ngữ lớn—làm thế nào để mở rộng khả năng của mô hình mà không khiến nó trở nên không ổn định hoặc bị lỗi trong quá trình huấn luyện.

Các kiến trúc AI truyền thống buộc tất cả thông tin phải đi qua một con đường hẹp duy nhất. mHC mở rộng con đường đó thành nhiều luồng có thể trao đổi thông tin mà không gây ra hiện tượng sụp đổ quá trình huấn luyện.

Wei Sun, nhà phân tích chính về AI tại Counterpoint Research, gọi mHC là một "bước đột phá đáng kinh ngạc" trong bình luận với Business Insider . Bà cho biết kỹ thuật này cho thấy DeepSeek có thể "vượt qua các nút thắt cổ chai về tính toán và mở khóa những bước tiến vượt bậc về trí tuệ nhân tạo", ngay cả khi bị hạn chế tiếp cận với các chip tiên tiến do các hạn chế xuất khẩu của Mỹ.

Lian Jye Su, nhà phân tích trưởng tại Omdia, nhận định rằng việc DeepSeek sẵn sàng công bố phương pháp của mình cho thấy "sự tự tin mới mẻ trong ngành công nghiệp AI Trung Quốc". Cách tiếp cận mã nguồn mở của công ty đã khiến nó trở thành cái tên được yêu thích trong giới lập trình viên, những người coi nó như hiện thân của OpenAI trước đây, trước khi chuyển hướng sang các mô hình đóng và các vòng gọi vốn tỷ đô la.

Không phải ai cũng tin tưởng. Một số nhà phát triển trên Reddit phàn nàn rằng các mô hình suy luận của DeepSeek lãng phí sức mạnh tính toán vào các tác vụ đơn giản, trong khi các nhà phê bình lập luận rằng các tiêu chuẩn đánh giá của công ty không phản ánh sự phức tạp trong thế giới thực. Một bài đăng Trung bình có tiêu đề "DeepSeek tệ hại - Và tôi không còn giả vờ như nó không tệ nữa" đã lan truyền rộng rãi vào tháng 4 năm 2025, cáo buộc các mô hình này tạo ra "những đoạn mã vô nghĩa đầy lỗi" và "các thư viện ảo tưởng".

DeepSeek cũng mang theo nhiều gánh nặng. Những lo ngại về quyền riêng tư đã gây khó khăn cho công ty, với việc một số chính phủ cấm ứng dụng gốc của DeepSeek. Mối quan hệ của công ty với Trung Quốc và những câu hỏi về kiểm duyệt trong các mô hình của họ làm tăng thêm ma sát địa chính trị trong các cuộc tranh luận kỹ thuật.

Tuy nhiên, đà phát triển là không thể phủ nhận. Deepseek đã được sử dụng rộng rãi ở châu Á, và nếu V4 thực hiện được những lời hứa về lập trình, thì việc áp dụng trong doanh nghiệp ở phương Tây có thể sẽ theo sau.

Vấn đề thời điểm cũng rất quan trọng. Theo Reuters , DeepSeek ban đầu dự định phát hành mẫu R2 vào tháng 5 năm 2025, nhưng đã gia hạn thời gian sau khi người sáng lập Liang không hài lòng với hiệu năng của nó. Giờ đây, với V4 được cho là sẽ ra mắt vào tháng 2 và R2 có thể sẽ ra mắt vào tháng 8, công ty đang tiến hành với tốc độ cho thấy sự khẩn trương—hoặc sự tự tin. Có lẽ là cả hai.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan