Tác giả: Cool Geek

Mô hình lớn có thể phân tích những gì đã xảy ra ở Trung Quốc trong 5.000 năm qua, nhưng không thể trả lời thời điểm hiện tại; nó có thể giải thích rõ ràng cơ học lượng tử là gì, nhưng rất khó để tạo ra một bản PPT chuyên nghiệp có cả hình ảnh và văn bản.
Tại sao các mô hình lớn có vẻ như toàn năng nhưng lại luôn thiếu tính ứng dụng thực tế?
Lý do rất đơn giản: thông minh và hiểu biết không có nghĩa là có khả năng làm việc.
Để trở nên thông minh đòi hỏi một mô hình lớn để đào tạo và học một lượng kiến thức lớn, để một bộ não phát triển có thể được đào tạo để trả lời tốt một câu hỏi;
Để thỏa mãn cả hai yếu tố thông minh và có năng lực, cần trang bị cho bộ não thông minh này những chi linh hoạt để đạt được "suy nghĩ độ sâu+ truyền đạt độ sâu".
Do đó, làm thế nào để thúc đẩy sự tiến hóa của các mô hình lớn từ tư duy thông minh đến đạt được "thông minh và có năng lực" đã trở thành chìa khóa để xác định liệu cơn sốt mô hình lớn này chỉ là nhất thời hay sẽ thay đổi lịch sử.
Baidu đã cung cấp bằng chứng.
Vào ngày 25 tháng 4, tại Hội nghị các nhà phát triển AI Baidu Create 2025, nhà sáng lập Baidu Robin Li đã giới thiệu Cangzhou OS, hệ điều hành liên quan đến nội dung đầu tiên trên thế giới do Baidu Wenku và Baidu Netdisk cùng ra mắt.
Bằng cách tích hợp đầy đủ các công nghệ, khả năng và dữ liệu cơ bản mà Baidu Wenku và Cloud Disk đã tích lũy trong quá khứ, nó có thể được tích hợp vào các tình huống khác nhau như nước, đạt được ngưỡng thấp và cung cấp chất lượng cao toàn diện theo hình thức hợp lý nhất và giao diện tương tác thuận tiện nhất cho người dùng.
Dựa trên viễn cảnh mong đợi và kỳ vọng của Cangzhou OS, Baidu Wenku và Baidu Netdisk đối với AI là đạt được khả năng cung cấp dịch vụ trọn gói, toàn diện mọi lúc, mọi nơi và trên mọi thiết bị đầu cuối, biến AI thành "toàn năng và phổ biến".
01
Hệ điều hành Cangzhou, cho phép AI phát triển lên cấp độ hệ điều hành
Trong ngành công nghệ, có một sự đồng thuận rằng bất kỳ công nghệ nào cũng cần phải trải qua quá trình đường cong Gartner dài từ phòng thí nghiệm đến gia đình.

Trong đường cong này, tăng trưởng ở giai đoạn đầu chủ yếu phụ thuộc vào kỳ vọng nhiệt tình của thị trường do tiến bộ công nghệ mang lại. Tuy nhiên, vì hiệu quả triển khai công nghệ không lý tưởng nên tăng trưởng trong giai đoạn này sẽ nhanh chóng suy giảm cho đến khi các điều kiện cần thiết để triển khai công nghệ dần hoàn thiện và được cụ thể hóa thành một cơ sở hạ tầng gần như không có ngưỡng, toàn năng và phổ biến. Sau đó, giai đoạn thứ hai của sự bùng nổ sinh thái sẽ diễn ra.
Một trong những dấu hiệu cho thấy giai đoạn thứ hai của ngành công nghiệp phần mềm đã bắt đầu thường là sự xuất hiện của một hệ điều hành hoàn thiện, chẳng hạn như Windows cho ngành công nghiệp máy tính và iOS cho ngành công nghiệp điện thoại di động.
Vậy bạn định nghĩa thế nào là một hệ điều hành trưởng thành? Khoảng 15 năm trước, đã có một cuộc tranh luận trong ngành công nghệ toàn cầu: Tại sao Apple hay điện thoại thông minh và các điện thoại thông minh trước đây lại là hai loại khác nhau khi tất cả đều có màn hình lớn, có thể gọi điện, chụp ảnh, nghe nhạc và gửi tin nhắn văn bản?
Một trong những lý do cốt lõi là iOS thừa hưởng tính ổn định ở cấp độ hạt nhân và khả năng đa nhiệm vụ từ MAC OS và biến nó thành hệ sinh thái mở nơi các nhà phát triển có thể tích hợp các khả năng cơ bản này của Apple theo ý muốn để tạo ra các ứng dụng sáng tạo của riêng họ. Sự kiện này cũng đã thay đổi cách định nghĩa về điện thoại di động, từ việc chỉ là vấn đề của một hoặc hai ông lớn, Motorola và Nokia, thành một ngành công nghiệp khổng lồ với khả năng vô hạn liên quan đến toàn bộ hệ sinh thái. Điều này đã mở ra cánh cửa cho Internet di động trong hơn một thập kỷ.
Công nghệ sẽ tiếp tục phát triển, nhưng những câu chuyện kinh doanh sẽ luôn lặp lại với tốc độ tương tự. Logic cơ bản đã được chứng minh trong hệ điều hành di động vẫn có thể áp dụng trong việc xây dựng hệ điều hành trong kỷ nguyên mô hình lớn.
Tóm lại, có ba điều: khả năng cơ bản hoàn chỉnh, lập lịch trình trung tâm linh hoạt và hệ sinh thái dịch vụ ứng dụng thịnh vượng. Nó tương ứng chính xác với kiến trúc ba lớp của Cangzhou OS: cơ sở hạ tầng cơ sở, hệ thống trung tâm và dịch vụ ứng dụng. Sự khác biệt duy nhất là cầu nối giữa ứng dụng và trung tâm và cơ sở đã được thay đổi từ API trước đó thành MCP chuẩn hóa hơn và có ngưỡng thấp hơn.

Thành phần cốt lõi của cơ sở hạ tầng cơ sở trong đó phần Máy chủ MCP là Chatfile plus, chủ yếu sử dụng một khuôn khổ dựa trên kiến thức để thực hiện phân tích và phân tích nội dung ở cấp độ phần tử theo nhiều chế độ, biểu mẫu và định dạng khác nhau, cũng như sê-ri các thành phần khuôn khổ công cụ như hiểu biết đa chế độ, truy xuất đa chế độ, chuyển mã và phân tích tệp.
Đồng thời, Baidu Wenku và Cloud Disk đã xây dựng "ba thư viện chính": cơ sở tri thức miền công cộng, cơ sở tri thức miền riêng và cơ sở bộ nhớ. Cụ thể, chúng đề cập đến dữ liệu kiến thức thuộc phạm vi công cộng được Baidu Wenku tích lũy trong nhiều năm (cơ sở kiến thức thuộc phạm vi công cộng), dữ liệu kiến thức được người dùng Cloud Disk ủy quyền (cơ sở kiến thức thuộc phạm vi riêng tư) và hướng dẫn trước đây, thói quen sử dụng và hồ sơ tạo lịch sử của người dùng trong Wenku hoặc Cloud Disk (cơ sở bộ nhớ).
Dữ liệu này thường được trình bày ở nhiều dạng, hình thức và định dạng khác nhau. Trong đó, cơ sở tri thức miền công cộng cung cấp kiến thức chung, trong khi cơ sở tri thức miền riêng tư và cơ sở bộ nhớ lưu trữ dữ liệu cá nhân của người dùng.
Trong khuôn khổ dựa trên kiến thức, Cangzhou OS sẽ vector hóa và gắn nhãn nội dung đa phương thức trong "ba thư viện chính", nghĩa là chuyển đổi dữ liệu phi cấu trúc như hình ảnh, văn bản, video, âm thanh, tài liệu, v.v. thành dữ liệu vector đa chiều mà máy tính có thể hiểu được thông qua các mô hình chuyên nghiệp khác nhau, tức là một tập hợp các mã thông báo.
Về hệ thống trung tâm, Baidu Wenku và Cloud Disk đã phát triển "ba công cụ chính" của riêng mình, cụ thể là trình soạn thảo hợp nhất (để chỉnh sửa tài liệu, PPT và nội dung khác), trình đọc (để đọc tài liệu, PPT và nội dung khác) và trình phát (để phát lại âm thanh và video).
Đồng thời, Cangzhou OS cũng có thể sử dụng "trung tâm lập lịch" để kết hợp bộ nhớ người dùng và dữ liệu chân dung thông qua các thành phần tương tác, mô hình ý định và cơ sở hạ tầng truyền tải để hiểu ý định của người dùng thông qua các mô hình và phân bổ hiệu quả các tác nhân lập lịch.
Ở cấp độ cao nhất là sê-ri các tác nhân AI. "Cangzhou OS"tích hợp hàng trăm tác nhân AI như thư viện tài liệu, PPT trên đĩa mạng, sách tranh AI, bản đồ tư duy AI, áp phích AI, ghi chú AI, quét AI, nghe AI, v.v. Các phương thức được tạo ra bao gồm nhiều loại khác nhau như hình ảnh, văn bản, video và âm thanh, đồng thời bao quát toàn diện các tình huống học tập, văn phòng, cuộc sống và giải trí. Nó cũng dựa vào khả năng chỉnh sửa, sửa đổi và tinh chỉnh của trình soạn thảo hợp nhất để nâng cao chất lượng truy xuất và tạo nội dung, phù hợp hơn với yêu cầu nhiệm vụ cá nhân thực tế.
02
Trên hệ điều hành Cangzhou,
Tạo ra nhiều tác nhân "thông minh và có năng lực" hơn
Tập trung vào các dịch vụ ứng dụng cấp cao nhất, Baidu Wenku và Baidu Netdisk đã ra mắt hàng trăm AI Agent hữu ích đã được hàng trăm triệu người dùng xác minh và cũng đã kết nối lượng lớn các Agent chuyên nghiệp của bên thứ ba để mở rộng hệ sinh thái ứng dụng.
Là "nền tảng tạo và thu thập nội dung AI trọn gói", Baidu Wenku có hơn 40 triệu người dùng trả phí và 97 triệu người dùng AI hoạt động hàng tháng. Baidu Netdisk cũng đã nâng cấp thành "nền tảng dịch vụ nội dung một cửa", phục vụ hơn 1 tỷ người dùng, với tổng không gian sử dụng hơn 100 tỷ GB và hơn 80 triệu người dùng AI hoạt động hàng tháng. Baidu Wenku và Baidu Netdisk đã trở thành "siêu năng suất" thực sự trong thời đại của các mô hình lớn.
Tại hội nghị, Baidu Wenku và Baidu Netdisk cũng trình diễn các tính năng mới được phát triển dựa trên "Cangzhou OS": "GenFlow Super Partner" và "AI Notes".
GenFlow là khả năng cộng tác đa tác nhân được Baidu Wenku APP ra mắt. Với sự hỗ trợ của "Cangzhou OS", việc tạo nội dung có thể được thực hiện song song và nhiệm vụ khác nhau có thể được cung cấp dựa trên thông tin mạng toàn diện và chuyên nghiệp nhất, nhiệm vụ và sở thích của người dùng.
Ví dụ, người dùng muốn lập kế hoạch đám cưới, nhưng thông tin đầu vào chỉ là một câu đơn giản: Tôi muốn tổ chức tiệc cưới ngoài trời ở Hải Nam vào ngày Quốc tế Lao động, vui lòng giúp tôi lập kế hoạch và viết thư mời.
Yêu cầu này có vẻ đơn giản và có thể giải quyết bằng cách điền vào chỗ trống dựa trên mẫu lịch sử. Tuy nhiên, để đạt được sự hài lòng của người dùng, chúng ta cần biết sở thích thẩm mỹ, kỳ vọng về ngân sách và sở thích về quy trình của người dùng. Chúng ta cũng cần biết thời tiết, lưu lượng giao thông và phân bổ địa điểm ở Hải Nam trong kỳ nghỉ lễ Quốc tế Lao động. Sau đó, chúng ta cần kết hợp những hình ảnh và văn bản này với kiến thức thông qua công cụ PPT để tạo thành một kế hoạch hoàn chỉnh. Cuối cùng, dựa trên kế hoạch và sở thích thẩm mỹ của người dùng, hãy tạo ra một tấm poster thiệp cưới hoàn chỉnh.
Để hoàn thiện nội dung trên, cần phải phân bổ riêng các bản ghi trò chuyện lịch sử của người dùng, bản ghi duyệt lịch sử cũng như công cụ nhận dạng ý định, tìm kiếm toàn mạng và PPT, phân tích ý định của người dùng, hiểu sở thích của người dùng và kết hợp các công cụ một cách tự do. Cuối cùng, người dùng sẽ được cung cấp một kế hoạch hoàn chỉnh rất cụ thể bao gồm quy trình, ngày tháng, địa điểm, ngân sách, chủ đề, chi tiết thực hiện, phong cách và sắp xếp nhân sự.
Đồng thời, đề xuất quy hoạch và poster mà người dùng yêu cầu phải trùng khớp với nhau, điều này đòi hỏi tất cả thông tin của cả hai phải thống nhất và được xuất ra song song bằng cùng một hệ điều hành.
Tất nhiên, AI không thể tạo ra kết quả làm hài lòng tất cả mọi người cùng một lúc, điều này đòi hỏi cả kế hoạch đám cưới và áp phích đều cần có thể chỉnh sửa được và khả năng hỗ trợ điều này được hỗ trợ bởi chức năng biên tập tích hợp của "Cangzhou OS".
Không khó để nhận ra rằng, từ tư duy độ sâu đến triển khai độ sâu, GenFlow Super Partner gần như là spot "hợp tác đa tác nhân" thực sự duy nhất trên thị trường. Nó không chỉ giải quyết các vấn đề thường gặp của các sản phẩm cộng tác đa tác nhân, chẳng hạn như chi phí cao, thời gian tạo ra dài, hiệu quả thấp, không có khả năng cung cấp ổn định và không có khả năng tối ưu hóa thông qua nhiều vòng đối thoại, mà còn được nhúng trực tiếp vào các sản phẩm hoàn thiện và kết hợp với dữ liệu sở hữu tư nhân do người dùng ủy quyền, mang đến cho AI cơ hội thực sự để đạt được mục tiêu trở nên "toàn năng và phổ biến".
Ghi chú AI của Baidu Netdisk là một công cụ mạnh mẽ dành cho vô số nhân viên văn phòng và những người đang chuẩn bị cho kỳ thi sau đại học và công chức.
AI Notes là AI Notes đa phương thức đầu tiên trong ngành. Nó có thể nhúng nhiều video ôn thi sau đại học và các trang ghi chú được người dùng lưu trữ trong Baidu Netdisk vào cùng một giao diện để đạt được liên kết mượt mà. Nội dung video và ghi chú có liên quan chặt chẽ với nhau, từ việc xem video, tạo ghi chú AI, tóm tắt sơ đồ tư duy AI và cuối cùng là AI đặt câu hỏi để kiểm tra kết quả học tập, bao phủ hoàn toàn toàn bộ chu trình học tập của người dùng.
Ví dụ, độ khó của kỳ thi tuyển sinh sau đại học bằng tiếng Anh đã trở thành chủ đề nóng cách đây một thời gian và người dùng muốn ôn tập tập trung cho kỳ thi tuyển sinh sau đại học bằng tiếng Anh. AI Notes trước tiên sẽ tìm kiếm thông tin có liên quan được lưu trữ trong đĩa mạng của người dùng và đồng thời truy vấn các điểm kiểm tra được cung cấp trong thông tin công khai trên Internet và sắp xếp chúng. Nhưng toàn bộ quá trình không dừng lại ở đó. AI Notes cũng sẽ kết hợp các câu hỏi trong các kỳ thi trước để tiến hành xác minh cuối cùng các điểm kiểm tra mà nó đã tạo ra. Chỉ những điểm kiểm tra đã được xác minh mới có thể tiếp tục tạo sơ đồ tư duy và dự đoán câu hỏi kiểm tra trên cơ sở này để giúp người dùng đẩy nhanh tiến độ học tập của mình.
Trong quá trình này, việc sử dụng các công cụ không kém gì việc lập kế hoạch đám cưới. Ví dụ, việc tìm điểm kiểm tra và câu hỏi thực tế đòi hỏi khả năng tìm kiếm toàn bộ mạng và các câu hỏi thực tế thường được trình bày ở dạng PDF hoặc thậm chí là dạng hình ảnh, còn lời giải thích của các giáo viên nổi tiếng được trình bày ở dạng video, đòi hỏi khả năng phân tích nội dung đa phương thức. Việc tạo bản đồ tư duy cuối cùng và dự đoán câu hỏi kiểm tra đòi hỏi khả năng lý luận của một mô hình lớn, khả năng tạo nội dung đa phương thức và khả năng lập bản đồ và liên kết các nội dung khác nhau, đồng thời đảm bảo độ chính xác tuyệt đối khi tạo nội dung.
Đằng sau đó là sự trao quyền của “Hệ điều hành Thương Châu”.
Tất nhiên, Baidu hỗ trợ các nhà phát triển áp dụng MCP đầy đủ, do đó Cangzhou OS không chỉ phục vụ hệ sinh thái nội bộ của Baidu. Phần quan trọng nhất trong quá trình phát triển và lớn mạnh của một hệ điều hành là mở ra với thế giới bên ngoài và kích thích khả năng đổi mới của các nhà phát triển.
Do đó, để tối đa hóa giá trị của hệ sinh thái và các ứng dụng, Baidu Wenku và Baidu Netdisk, dựa trên "Cangzhou OS", là những công ty đầu tiên tận dụng đầy đủ MCP để liên kết các sản phẩm và hệ sinh thái, xây dựng hệ thống ba tầng MCP Server-Client-Host, mở ra khả năng của Wenku và Netdisk dưới dạng MCP Server và thông qua MCP Client SDK, tạo điều kiện thuận lợi cho nhiều người dùng doanh nghiệp, nhà phát triển và ứng dụng thông minh hơn truy cập vào MCP Host.

Trong đó, trường hợp tiêu biểu nhất là điện thoại di động Samsung. Điện thoại Samsung kết nối với nhiều máy chủ MCP để tải lên, tải xuống, tìm kiếm, chia sẻ và hiểu nội dung của Baidu Wenku Cloud Disk.
Một mặt, người dùng có thể trực tiếp thực hiện các chức năng như tải tệp lên đĩa mạng để sao lưu, chia sẻ trên đám mây, tóm tắt tài liệu và hỏi đáp nội dung bằng cách nói trong giao diện trợ lý giọng nói của điện thoại di động.
Mặt khác, các máy chủ này cũng có thể làm phong phú thêm khả năng lưu trữ đám mây của hệ thống điện thoại di động Samsung và giải quyết vấn đề khó sao lưu và chia sẻ nhiều tệp lớn trên điện thoại di động.
Ví dụ, trong album ảnh trên điện thoại di động, người dùng có thể gọi trợ lý giọng nói và nói: "Sao lưu ảnh chụp ở O'Sen hôm qua vào Baidu Netdisk và gửi ảnh của Xiao Ming cho anh ấy". Những bức ảnh có liên quan sẽ được tải lên tài khoản đám mây được người dùng ủy quyền và liên kết chia sẻ sẽ được tạo. Sau đó, trợ lý điện thoại di động sẽ gọi đến sổ địa chỉ và gửi liên kết này đến điện thoại di động của bên kia qua tin nhắn văn bản. Chỉ cần nhấn liên kết, người dùng có thể trực tiếp vào Baidu Cloud Disk để xem hoặc chuyển ảnh.
Không còn nghi ngờ gì nữa, việc kiểm tra xem khả năng cơ bản của hệ điều hành có đáng tin cậy hay không không phụ thuộc vào việc xếp chồng các công cụ hay số lượng công nghệ đen. Tiêu chuẩn kiểm tra tốt nhất cho khả năng của hệ điều hành là hệ sinh thái dịch vụ ứng dụng cấp cao có dễ sử dụng, hoàn thiện và phong phú hay không.
03
Câu chuyện về hệ điều hành không có hồi kết
Trên thị trường vốn, loại công ty được các nhà đầu tư biết đến nhiều nhất được gọi là "Friends of Time".
Cái gọi là người bạn của thời gian có nghĩa là khi một công ty làm đúng việc gì đó, họ chỉ cần tiếp tục làm, hiệu suất của công ty sẽ duy trì tăng trưởng liên tục, và các nhà phát triển sinh thái sẽ tiếp tục được hưởng lợi.
Hệ điều hành là một thị trường máy chuyển động vĩnh cửu điển hình. Chừng nào thị trường máy tính và điện thoại di động còn tồn tại thì câu chuyện về các hệ điều hành thuộc về Microsoft, Apple và Google sẽ vẫn chưa có hồi kết.
Điều này cũng đúng với các mô hình lớn. Khi "suy nghĩ độ sâu+ truyền tải độ sâu+ dữ liệu công và tư + sinh thái MCP" kết hợp với nhau, tương lai sẽ trở thành AI toàn năng và phổ biến của kỷ nguyên mới, khi đó sự bùng nổ các loài mới ở kỷ Cambri sẽ tiếp tục xuất hiện.
Trong quá trình này, khi nhìn xuống, chúng ta có thể thấy Baidu Wenku, Baidu Netdisk và các nền tảng khác đang mở ra khả năng riêng của họ. Bằng cách chủ động bảo vệ hệ sinh thái, chúng ta trở thành người sáng tạo ra các loài mới, các mô hình lớn và là người đặt ra các quy tắc mới.
Nhìn lên trên, vô số tác nhân mới được tạo ra và nhìn thấy dựa trên "Cangzhou OS", hình thành nên một hệ sinh thái dịch vụ ứng dụng mới tuyệt vời.
Và bây giờ, mọi câu chuyện mới chỉ bắt đầu.




