Tại sao Liang Wenfeng lại tạo ra DeepSeek?

Bài viết này được dịch máy
Xem bản gốc
Dưới đây là bản dịch tiếng Việt của văn bản trên:

Nguồn: AI科技评论

Đây là ngôi sao công nghệ nổi bật nhất đầu năm 2025, trong vài ngày, mọi thứ về quá khứ của Lương Văn Phong đều được phơi bày trước công chúng, bao gồm cả căn nhà mới chưa kịp sửa sang và chiếc lều ngủ trong nhà, tất cả đều trở thành biểu tượng của cá tính độc đáo của anh.

Cá tính độc đáo tuy khiến mọi người chú ý, nhưng không phải là chìa khóa thành công. Chỉ có suy nghĩ và năng lực của mình là điều mà sinh viên vô danh này có thể dựa vào trong hơn mười năm qua.

Mọi người đều tò mò về một câu hỏi, tại sao lại là Lương Văn Phong tạo ra DeepSeek? Chắc chắn trong đó có yếu tố thời đại, cũng như quá trình cá nhân khác biệt của anh so với các nhà nghiên cứu mô hình lớn khác. Nhưng AI科技评论cho rằng, hiểu Lương Văn Phong là người như thế nào mới là chìa khóa để hiểu câu hỏi này.

1 Tìm nhân tài không cần nhãn mác

Các nhà tuyển dụng đều cảm thấy rằng, tìm người cho công ty của Lương Văn Phong quá khó khăn.

Một nhà tuyển dụng đã hợp tác sâu với Huyễn Phương từ năm 2021 cho biết, tuyển dụng khiến anh "muốn khóc", vì độ khó quá cao.

"Tốt nghiệp Thanh Hoa, 6 bài đăng hội nghị hàng đầu, bạn nghĩ chắc chắn không vấn đề gì đúng không, ôi, sao hồ sơ lại bị loại luôn; một cử nhân Thanh Hoa, tiến sĩ MIT, vòng phỏng vấn thứ hai lại bị loại."

Nếu muốn tìm ứng viên bên trong các công ty lớn, anh cho rằng, Huyễn Phương và DeepSeek cơ bản sẽ không so sánh với các công ty trong nước, mà chỉ so sánh với các công ty lớn ở nước ngoài như Google và Meta.

Một nhà tuyển dụng khác cũng không nhịn được mà đau đầu khi nhắc đến DeepSeek, "Họ quá khắt khe, tôi đã giới thiệu một người trẻ tuổi làm rất tốt ở Byte, nhưng sau khi nói chuyện thì không qua. Tôi rất ngạc nhiên, hỏi họ, câu trả lời là, người này không có đam mê với AI." Những người như vậy thường không nói như vậy.

Lương Văn Phong không có nhãn mác cho nhân tài, không quan tâm học vấn, quá khứ, chỉ xem xét năng lực và phẩm chất cá nhân của người đó.

Tiêu chuẩn nhân tài cực cao đã tạo nên DeepSeek như ngày nay. Trong các nhóm mô hình lớn trong nước, độ dày nhân tài của DeepSeek có thể không đủ để so sánh với các công ty hàng đầu, nhưng về mật độ nhân tài thì chắc chắn là hàng đầu.

Để giữ chân những nhân tài này, ngoài mức lương cao của DeepSeek, còn có mô hình quản lý tôn trọng sáng tạo và ý tưởng. "Không có nhóm cố định, không có mối quan hệ báo cáo, không có kế hoạch hàng năm" - nói như vậy không phải là quản lý, mà là sự tin tưởng. Sách "Cẩm nang văn hóa Netflix" từng nói, "Đồng nghiệp xuất sắc và thách thức khó khăn là những yếu tố thu hút mọi người đến làm việc tại công ty". Đối với những người làm AI, không có thách thức nào lớn hơn AGI.

Làm những việc khó nhất, cần tìm những người giỏi nhất, cung cấp đủ nguồn lực và sự tin tưởng. Nhân tài hàng đầu được tin tưởng thường mang lại sức bùng nổ lớn, điều này có thể được chứng minh trong sự trỗi dậy của Douyin.

Trong dịp Tết năm 2018, Douyin có hơn 10 triệu người dùng mới mỗi ngày. Một quản lý sản phẩm phụ trách tăng trưởng từng nói, dự án tăng trưởng này hoàn toàn không có áp lực thành tích, và anh ta đã gửi một email cho tài chính, tài khoản của anh ta có thêm hàng tỷ đồng ngân sách quảng cáo. Lúc đó anh ta đã nhận ra, "Với nhóm như vậy, làm gì cũng thắng chứ."

DeepSeek cũng tương tự. Những người bị loại hồ sơ chắc chắn không phải do vấn đề học vấn; không qua phỏng vấn, chắc chắn cũng không phải do năng lực. Nhu cầu nhân tài tập trung vào một câu, đó là người này có thể được tin tưởng cùng nỗ lực vì AGI hay không?

Đây chính là quan điểm về nhân tài của DeepSeek, hiểu quan điểm này là bước đầu tiên để hiểu Lương Văn Phong.

2 Quan điểm giản dị

Mặc dù đã làm định lượng nhiều năm, nhưng Lương Văn Phong không cho rằng mình là người làm tài chính, ông tự nhận mình là "người làm AI, chỉ là trong bối cảnh định lượng".

Hầu hết những người từng trao đổi với Lương Văn Phong đều nói rằng ông là người không bị ảnh hưởng bởi bên ngoài, "Cách suy nghĩ của ông rất tinh khiết, đặc biệt chú trọng nguyên lý cơ bản", "Nói chuyện rất chậm", "Ngay từ đầu đã nắm bắt được vấn đề chính".

Đặc tính của đầu tư định lượng vừa khớp với phong cách giản dị của ông - nó không cần phải giao dịch với chuỗi ngành công nghiệp phức tạp, chỉ cần tập trung vào dữ liệu thị trường thuần túy.

Cho đến ngày nay, Lương Văn Phong vẫn thường chìm đắm trong thế giới kỹ thuật của mình, tập trung giải quyết vấn đề. Ví dụ như việc xây dựng mô hình lớn, ông sẽ nói với người khác, "Nghĩ rõ ràng rồi thì làm được, chỉ cần có card là được", những khó khăn khác không nằm trong phạm vi cân nhắc của ông.

Cách đối xử với tiền bạc cũng như vậy. Tiền chỉ dùng để đầu tư hoặc làm từ thiện, chỉ cần có thể chi tiêu ở đúng nơi, lỗ vốn cũng không đáng kể.

Vào cuối năm 2023, có một dự án mô hình lớn về ngôn ngữ ký hiệu nhằm hỗ trợ người khiếm thính, đã tìm đến Lương Văn Phong để kêu gọi đầu tư. Lương Văn Phong đề xuất, ưu điểm của dự án này là tính công ích nổi bật, nhược điểm là quy mô thị trường hạn chế, nguy cơ ẩn là đây là dự án của một nhóm sinh viên đại học hàng đầu, họ có thể sẽ không kiên trì lâu dài.

Mặc dù rất có thể sẽ không thu được bất kỳ khoản hoàn vốn nào, ông vẫn đề xuất rằng, chỉ cần nhóm vẫn muốn tiếp tục thúc đẩy dự án, ông sẵn sàng đầu tư.

Trước đây, Lương Văn Phong sẽ dành 500 triệu đồng mỗi năm cho đầu tư hoặc từ thiện, nhưng bây giờ ông đã dành toàn bộ số tiền này cho DeepSeek. Chứng khoán là để kiếm tiền, đầu tư vào mô hình lớn là để AGI, chỉ có vậy thôi.

DeepSeek có gần 20.000 card, ông rất hào phóng với tỷ lệ băm, đối với nhóm mô hình ngôn ngữ ký hiệu nói trên, ông đã hứa sẽ mở cụm card tính toán cho họ bất cứ lúc nào. Nhưng ông cũng hơi "keo kiệt", yêu cầu sử dụng tối đa 20.000 card này, không được để chúng chạy không.

Hai hành vi này có vẻ mâu thuẫn, nhưng nếu giải thích theo quan điểm giản dị, thì điều đó hoàn toàn hợp lý: card chỉ tồn tại để sử dụng, phải sử dụng hết, tuyệt đối không được lãng phí.

3 Không giới hạn bởi thương mại hóa

Không tốn một xu phí quảng cáo, ứng dụng DeepSeek chỉ trong 7 ngày đã đạt được 100 triệu người dùng, về sự tăng trưởng kỳ diệu này, Lương Văn Phong nghĩ gì?

Có một nhà đầu tư đã hỏi Lương Văn Phong câu hỏi này trong dịp Tết, nhưng Lương Văn Phong dường như hoàn toàn không quan tâm đến lưu lượng khổng lồ này, câu trả lời mà nhà đầu tư nhận được là, "Điều này vẫn còn rất xa với con đường đến AGI".

Đây không phải là Lương Văn Phong đang giả vờ. Theo AI科技评论được biết, DeepSeek chỉ bố trí 2-3 người phụ trách bảo trì ứng dụng, phát triển trang web trò chuyện và quản lý hậu trường nạp tiền. Vì vậy, việc ứng dụng không thể sử dụng tốt là điều bình thường.

Những câu chuyện về hoạt động của DeepSeek ở thị trường B lại được truyền bá rộng rãi hơn. Ví dụ như trước đây, giá triển khai riêng tư của họ chỉ 450.000 đồng, bao gồm quyền sử dụng một máy H20 hoặc 910b, cùng với dịch vụ mô hình lớn, thời hạn sử dụng là 1 năm. Trong khi cùng mức giá đó, chỉ có thể thuê quyền sử dụng 910b trong 1 năm trên Huawei Cloud, điều này có nghĩa là DeepSeek cung cấp mô hình lớn gần như miễn phí.

Triển khai riêng tư không kiếm tiền, DeepSeek cũng không quan tâm kiếm tiền từ API. Một nhân viên của một công ty lớn tiếp xúc với DeepSeek than phiền rằng, nó có một "thích dùng không dùng" thái độ, luôn rất khó sử dụng, luôn không điều chỉnh.

Dù khách hàng lớn và lượng gọi API có lớn đến đâu, cũng không được nhìn nhận đặc biệt. Tất cả các công ty lớn trong thời điểm cao điểm đều

Đây là lời khuyên dành cho bạn thân, cũng là việc thực hành của chính mình. Đối với TRON, việc đầu tư vào các ứng dụng và thương mại hóa, bất kể làm gì, đều là một con đường sai lầm.

Và con đường đúng đắn chỉ có một, hiện tại anh ấy đã đi trên con đường đúng đắn.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận