Vinh quang của DeepSeek: "Sáu chú rồng nhỏ" cô đơn

Bài viết này được dịch máy
Xem bản gốc
Trong bối cảnh DeepSeek tiếp tục bùng nổ, "Lục Long Tiểu" vốn đã đi theo hướng phân hóa sẽ tăng tốc tái cơ cấu.

Tác giả: Ngô Thiên Ngữ

Niềm vui và nỗi buồn của con người không thể cùng cảm thông. Kể từ năm 2016 - năm khởi đầu của trí tuệ nhân tạo, ngành công nghiệp AI đã trải qua nhiều vòng tái cơ cấu, và với sự hỗ trợ của ChatGPT, DeepSeek như một con cá tra đã khuấy động toàn bộ thị trường mô hình lớn. Các công ty khởi nghiệp mô hình lớn, được coi là "Lục Long Tiểu" mới nổi, so với DeepSeek, có thể nói là "mặt trời mọc ở phương Đông, mưa rơi ở phương Tây".

Sau khi ra mắt DeepSeek-V3 với chi phí thấp và hiệu suất tương đương GPT-4o vào cuối năm trước, DeepSeek tiếp tục công bố mô hình R1 vào ngày 20/1, và chỉ sau 6 ngày đã đứng đầu bảng xếp hạng tải xuống miễn phí toàn cầu của App Store Apple, với tổng số lượt tải xuống vượt 1,1 tỷ sau 1 tháng. Trong thời gian này, các nhà cung cấp dịch vụ đám mây lớn đã nhanh chóng ra mắt các phiên bản mã nguồn mở của V3 và R1, và các sản phẩm như Baidu Search, WeChat cũng đang tích cực ôm lấy DeepSeek.

Trong khi đó, các mô hình Kimi toàn cầu về học tăng cường k1.5 và mô hình suy luận bước nhảy Step R-mini, được ra mắt cùng thời điểm với DeepSeek, mặc dù có nhiều khả năng tương tự o1 ở nhiều mặt, nhưng vẫn bị lấn át bởi sự nổi tiếng của DeepSeek.

So với sự ồn ào của DeepSeek, "Lục Long Tiểu" cũng liên tiếp đưa ra các tin tức: Zero One vạn vật tiếp tục chia tách, Yuè Zhī Àn Miàn chưa giải quyết được ngân sách và vụ kiện trọng tài, MIniMax lại có một lãnh đạo cấp cao từ chức...

Và đằng sau đó còn có những VC thất vọng: các dự án họ hỗ trợ bằng tiền thật, không có dự án nào đạt được độ nóng như DeepSeek. Hiện tại, đã có 4 trong số "Lục Long Tiểu" không có tin tức về huy động vốn trong hơn nửa năm. Năm 2024, ngành công nghiệp dự đoán rằng 2 trong số "Lục Long Tiểu" sẽ bị loại bỏ, và năm 2025, ai sẽ là kẻ tiếp theo?

Chỉ còn 3 công ty tiếp tục đầu tư vào mô hình lớn

Sự bùng nổ của DeepSeek không phải không có dấu hiệu. Kể từ khi ra mắt mô hình đầu tiên DeepSeek Coder vào ngày 2/11/2023, họ đã ra mắt hơn 10 phiên bản mô hình khác nhau trong hơn 1 năm. Trong đó, mô hình V2 ra mắt vào tháng 5 năm ngoái, có hiệu suất ngang ngửa GPT-4 Turbo nhưng chỉ có giá bằng 1% của GPT-4, vì vậy DeepSeek được gọi là "kẻ giết giá" và "Pinduoduo của ngành AI", đồng thời khởi động cuộc chiến giá cả đầu tiên trong ngành mô hình lớn.

Vào ngày 27/1/2025, DeepSeek đã vượt qua ChatGPT, đứng đầu bảng xếp hạng ứng dụng miễn phí khu vực Trung Quốc và Mỹ trên App Store Apple, thu hút sự chú ý toàn cầu. Thành tựu này của DeepSeek là nhờ mô hình suy luận lớn DeepSeek-R1. Theo thông tin công bố của DeepSeek, R1 đạt điểm gần với phiên bản chính thức của o1 trong nhiều bài kiểm tra uy tín, và thậm chí vượt qua o1 ở một số bài kiểm tra.

Ngoài điểm số trên bảng xếp hạng, sự kết hợp giữa mã nguồn mở và hiệu quả chi phí cũng là những yếu tố quan trọng khiến DeepSeek gây được nhiệt độ kinh hoàng. Chịu ảnh hưởng của DeepSeek, nhà sáng lập Baidu Lý Yanhong - người trước đây là tín đồ của mô hình đóng, cũng đã tuyên bố gia nhập phe mã nguồn mở, và Sam Altman - nhà sáng lập OpenAI, cũng đã suy ngẫm lại rằng công ty đã ở "sai phía" trong chiến lược mã nguồn mở.

Trong "Lục Long Tiểu" của mô hình lớn, MiniMax đã ra mắt mô hình mã nguồn mở đầu tiên vào ngày 15/1, và nhà sáng lập Yán Jùnjié trong cuộc phỏng vấn với "Wǎndiǎn" cũng cho biết: "Lần khởi nghiệp đầu tiên thiếu nhiều kinh nghiệm, nếu có thể chọn lại, ngày đầu tiên nên mã nguồn mở ngay." Trong số 5 "Long Tiểu" còn lại, chỉ có Zhìpǔ là sớm nhất áp dụng cả mô hình mã nguồn mở và đóng. Sau gần 2 năm lăn lộn, "Lục Long Tiểu" đã đi theo hướng hoàn toàn trái ngược.

Zero One vạn vật là công ty đầu tiên công khai điều chỉnh lớn về công ty mô hình cơ bản, trước tiên là sa thải nhóm thuật toán tiền huấn luyện và nhóm Infra, một số nhân viên gia nhập Alibaba dưới hình thức nghỉ việc, sau đó công bố thành lập phòng thí nghiệm mô hình lớn liên kết với Alibaba Cloud và Khu công nghệ cao Tô Châu.

Về nhân sự, Hoàng Văn Hạo - người phụ trách huấn luyện mô hình, Lam Vũ Xuyên - người phụ trách nền tảng API mô hình lớn, Tào Đại Bằng - người phụ trách sản phẩm năng suất, đều lần lượt rời khỏi công ty. Zero One vạn vật, những người cố gắng留在bàn cờ, không thể che giấu được sự suy thoái trong cuộc cạnh tranh mô hình lớn này.

Bách Xuyên Trí Tuệ thì đã xác định rõ hướng đi là lĩnh vực y tế vào năm 2024, gần đây đã ra mắt "Bác sĩ Nhi khoa AI" đầu tiên. Trong việc thương mại hóa B2B, Bách Xuyên dường như không được thuận lợi lắm, Hồng Đào - đồng sáng lập và người phụ trách kinh doanh, đã nghỉ việc trước Tết. Một nhân viên của Bách Xuyên cho biết, hiện tại sau khi có DeepSeek, áp lực trong năm nay chỉ tăng chứ không giảm.

Người phụ trách kinh doanh B2B cũng rời khỏi MiniMax là Vệ Vĩ, trước đó Vệ Vĩ trong cuộc phỏng vấn đã nói rằng nhiều khách hàng B2B sẽ không dễ dàng bỏ tiền ra để hỗ trợ doanh thu của các công ty mô hình lớn, chỉ có thể dựa vào năng lực nghiên cứu và thuật toán để giúp khách hàng đạt được hiệu quả đầu ra trong các tình huống thực tế, điều này cũng chứng minh việc thương mại hóa mô hình lớn không phải là chuyện dễ dàng.

Như vậy, những người vẫn tập trung vào đổi mới kỹ thuật mô hình lớn và theo đuổi AGI chỉ còn lại Yuè Zhī Àn Miàn, Zhìpǔ và Tiểu Nhảy Tinh Thần. Chịu ảnh hưởng của DeepSeek, Tiểu Nhảy Tinh Thần cũng gia nhập phe mã nguồn mở, khác với DeepSeek tập trung vào mô hình văn bản, mới nhất Tiểu Nhảy Tinh Thần mở mã nguồn là hai mô hình đa phương thức - Step-Video-T2V và Step-Audio.

Vào rạng sáng ngày 23/2, Yuè Zhī Àn Miàn công bố bài báo mới nhất "Muon is Scalable for LLM Training" và mở mã nguồn mô hình MoE Moonlight, chỉ cần 3B tham số kích hoạt. Nhiều người trong ngành cho rằng đây là "đánh cắp tuần lễ mã nguồn mở", vì trước đó DeepSeek đã tuyên bố sẽ liên tiếp 5 ngày ra mắt các dự án mã nguồn mở.

Đối với Yuè Zhī Àn Miàn, có lẽ vấn đề cấp bách là khoản đầu tư lớn vào sản phẩm Kimi.

Đốt tiền đầu tư khó trở thành "Vua bảng xếp hạng"

Giống như "Lục Long Tiểu", DeepSeek cũng có sản phẩm C-end cùng tên, nhưng sau khi ra mắt trong tuần đầu tiên, nó không thu hút quá nhiều sự chú ý trên thị trường. Dữ liệu do QuestMobile cung cấp cho các phương tiện truyền thông cho thấy, trong khoảng thời gian từ ngày 13/1 đến 19/1/2025, lượng tải xuống tuần của ứng dụng DeepSeek chỉ là 285.000, xa xa so với Douban (4,52 triệu) và Kimi (1,557 triệu).

Sau khi ra mắt R1 vào ngày 20/1/2025, lượng tải xuống của DeepSeek bắt đầu tăng vọt, nghiên cứu của Sensor Tower cho thấy, trong vòng 18 ngày sau buổi ra mắt, lượng tải xuống của DeepSeek đã vượt 16 triệu, gần gấp đôi 9 triệu lượt tải đầu tiên của ChatGPT của OpenAI.

Lượng truy cập tăng vọt đã một度khiến DeepSeek sập, nhưng ngay cả như vậy, đà tăng trưởng vẫn rất mạnh mẽ, với hơn 1,1 tỷ lượt tải xuống trong tháng. Sự rực rỡ của DeepSeek không còn ai có thể bỏ qua, ngày 13/2, trong cuộc họp toàn thể nội bộ của ByteDance, CEO Lương Như Sóng đã phản tỉnh về tốc độ phản ứng chậm, và năm nay sẽ phấn đấu để ra mắt các sản phẩm thông minh.

WeChat của Tencent đã tiến hành thử nghiệm xám kết nối tìm kiếm AI của DeepSeek, và sau khi lượng sử dụng vượt quá dự kiến, họ đã gọi hỗ trợ từ ứng dụng AI Ngọc Bội để hỗ trợ tìm kiếm trên WeChat. Ngày 22/2, Ngọc Bội của Tencent đã vượt qua Douban của ByteDance, trở thành ứng dụng miễn phí h

Các ngôi sao lên xuống, vạn vật từ 0 đến 1, AI Compass và Baichuan Trí tuệ cũng có các sản phẩm ứng dụng AI của riêng họ, nhưng theo bảng xếp hạng sản phẩm AI, vào tháng 1/2025, không có một ứng dụng AI nào trong số 20 ứng dụng có lượng người dùng hoạt động hàng tháng cao nhất liên quan đến bốn nhà sản xuất này. Trước đó, một nhân viên của Baichuan Trí tuệ đã nói với "AI Quang Niên" rằng, "Việc giữ chân và tăng trưởng người dùng của Baochao rất kém, chúng tôi gần như không làm quảng cáo, để các công ty khác trước tiên tốn tiền để giáo dục người dùng."

Hiện tại, DeepSeek, Tencent Yuanbao và Byte Doubaobao đang chiếm ba vị trí đầu tiên trong bảng xếp hạng tải về ứng dụng miễn phí của Apple. Để các mô hình lớn "Lục Tiểu Long" lọt vào bảng xếp hạng, cuộc cạnh tranh sẽ càng gay gắt, hiện Nano Search đang ở vị trí thứ bảy, Châu Hồng Phúc đang trực tiếp "bán hàng".

Một đối thủ khác không thể bỏ qua chính là Alibaba, sau khi ứng dụng AI Tongyi được sáp nhập vào Tập đoàn Thông tin Thông minh của Alibaba, gần đây Alibaba đã mở rộng tuyển dụng quy mô lớn cho các vị trí liên quan đến sản phẩm và nghiên cứu phát triển mô hình lớn AI. Phía trước có sói, phía sau có hổ, đó chính là bức tranh thực tế của tình hình hiện tại của các mô hình lớn "Lục Tiểu Long".

Khi câu chuyện công nghệ không còn lãng mạn, thương mại hóa không như dự kiến, số lượng người dùng hoạt động hàng tháng của sản phẩm không tỷ lệ với đầu tư, các mô hình lớn "Lục Tiểu Long" đang phải đối mặt với một thực tế khắc nghiệt.

Ngưỡng vốn vòng tài trợ tiếp theo tăng lên

Việc tiền huấn luyện mô hình lớn tiêu tốn rất nhiều tiền là một sự thật được công nhận, Li Kaifu đã tiết lộ rằng, chi phí của một lần tiền huấn luyện khoảng 3-4 triệu USD, ngay cả Yi-Lightning với chi phí thấp hơn, trong quá trình huấn luyện cũng đã sử dụng 2.000 GPU và mất một tháng rưỡi, tốn hơn 3 triệu USD.

Ngay cả DeepSeek, được quảng cáo là có chi phí thấp, cũng có khoản đầu tư ban đầu khó ước lượng, tổ chức độc lập SemiAnalysis tính toán, DeepSeek thực sự có một lượng tài nguyên tính toán khổng lồ: tổng cộng 60.000 card GPU NVIDIA, bao gồm 10.000 card A100, 10.000 card H100, 10.000 card "phiên bản đặc biệt" H800 và 30.000 card "phiên bản đặc biệt" H20.

"Chi phí huấn luyện mô hình lớn phổ dụng, chúng tôi ước tính khoảng 1 tỷ USD, đây chỉ là phần tài nguyên tính toán, chưa tính đến hai phần rất tốn kém khác, một là dữ liệu, hai là chi phí nhân lực, hiện nay nhân tài trong lĩnh vực mô hình lớn toàn cầu rất khan hiếm," Tiến sĩ Du Feng, đồng sáng lập và cựu Giám đốc Đầu tư Microsoft Trung Quốc của Tường Môn Venture, từng nói với tác giả.

Do cần phải đầu tư quá lớn, trong một thời gian dài, ngành đã phổ biến một quan điểm: "Vé vào cửa" để đầu tư vào các công ty mô hình lớn là 100 triệu USD. Điều này cũng có nghĩa là, nếu một công ty khởi nghiệp mô hình lớn không thể huy động vốn, sẽ rất khó để tồn tại.

Sau khi "Trận chiến 100 mô hình" bùng nổ vào năm 2023, gần như mỗi tháng lại có tin tức về vòng tài trợ, nhưng khi luận điệu về bong bóng AI ngày càng lan rộng, từ tháng 9/2024, trong một thời gian dài không có dòng vốn nóng hàng tỷ USD chảy vào "Lục Tiểu Long" mô hình lớn. Cho đến trước Tết Nguyên đán 2025, AI Compass và Jiaoyue Star lần lượt công bố nhận được "tiền qua đông", trước đó AI Compass công bố hoàn thành vòng tài trợ mới trị giá 3 tỷ NDT, sau đó Jiaoyue Star hoàn thành vòng B trị giá hàng triệu USD.

Bốn thành viên còn lại trong "Lục Tiểu Long" đã hơn nửa năm không có thông tin về vòng tài trợ mới: MiniMax công bố hoàn thành vòng B trị giá 600 triệu USD vào tháng 3 năm ngoái, Baichuan Trí tuệ nhận được 5 tỷ NDT vốn A vào tháng 7 năm ngoái, Zero-One Wanwu hoàn thành vòng tài trợ mới trị giá hàng triệu USD vào tháng 8 năm ngoái, Yuezhi Anmian hoàn thành vòng tài trợ 300 triệu USD vào tháng 8 năm ngoái.

Trong dịp Tết Nguyên đán, DeepSeek trở nên nổi tiếng toàn cầu, dư luận không tiếc lời ca ngợi DeepSeek và người sáng lập Lương Văn Phong. Trong giới đầu tư, gần đây đã có nhiều tin đồn về việc DeepSeek sẽ mở vòng tài trợ và định giá bao nhiêu.

Trước đó, có tin cho rằng Alibaba sẽ đầu tư 1 tỷ USD với mức định giá 10 tỷ USD, chiếm 10% cổ phần. Về vấn đề này, Phó Tổng Giám đốc Alibaba Yan Qiao đã nhanh chóng phủ nhận thông tin này trên Wechat, cho rằng "Thông tin Alibaba đầu tư vào DeepSeek đang lưu truyền ngoài kia là tin giả". Sau đó, truyền thông quốc tế đưa tin "DeepSeek lần đầu tiên xem xét huy động vốn bên ngoài", nhưng người liên quan của DeepSeek đã phủ nhận, cho rằng các thông tin về vòng tài trợ đều là tin đồn.

"Không ít nhà đầu tư trực tiếp hoặc nhờ mối quan hệ liên hệ với Lương Văn Phong, tôi dự đoán mức định giá của DeepSeek sẽ vượt xa 'Lục Tiểu Long' mô hình lớn hiện tại," một nhà đầu tư của Trung Quốc Jinxin cho biết, "DeepSeek đã trở thành đối tượng chuẩn, 'Lục Tiểu Long' muốn huy động vốn mới ở thị trường sơ cấp, rõ ràng ngưỡng đã cao hơn nhiều."

Thực tế, kể từ khi cơn sốt khởi nghiệp mô hình lớn bùng nổ, ngành nói chung không quá tin tưởng rằng "Lục Tiểu Long" cuối cùng sẽ có thể tồn tại như các "công ty mô hình lớn độc lập". Một số người sáng lập trong "Lục Tiểu Long" cũng đã công khai bày tỏ quan điểm tương tự, như Yán Junjie, người sáng lập MiniMax, cho rằng trong tương lai chỉ còn lại 5 công ty mô hình lớn toàn cầu.

"Trung Quốc chắc chắn sẽ có ChatGPT của riêng mình. Giống như công cụ tìm kiếm, chúng tôi có các yêu cầu tuân thủ của riêng mình. Nhưng ChatGPT phiên bản Trung Quốc chỉ sẽ xuất hiện ở 5 công ty: BAT + ByteDance + Huawei," Chương Hào, nhà sáng lập Thunderbolt và Quanwang Capital, từng nói với tác giả.

Dưới sức nóng không ngừng, "Lục Tiểu Long" đang dần phân hóa sẽ tăng tốc quá trình tái cơ cấu.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận