Hermes Agent giải quyết vấn đề gì?

Bài viết này được dịch máy
Xem bản gốc

Tác giả: Zhang Feng

Năm 2026, cuộc đua AI Agent toàn cầu chính thức vượt ra khỏi giai đoạn ý tưởng ban đầu và bước vào giai đoạn thực tế đầy thách thức, đặc trưng bởi sự cạnh tranh về khung phần mềm và quá trình triển khai gian khổ. Sau hai năm tăng trưởng bùng nổ, ngành công nghiệp này đã bộc lộ những điểm yếu chung: hầu hết các AI agent đa năng đều gặp phải sáu vấn đề cốt lõi: mất khả năng ghi nhớ thông tin trên mạng, thiếu khả năng tự phát triển, phụ thuộc vào thiết lập thủ công, thiếu chủ quyền dữ liệu, dễ bị tổn thương khi thực hiện nhiệm vụ phức tạp và triển vọng thương mại hóa không rõ ràng. Lượng lớn khung phần mềm chỉ có thể hoàn thành các cuộc hội thoại lần và thực thi các lệnh đơn giản, không đáp ứng được nhu cầu thực sự của công việc kỹ thuật số lâu dài, tự động hóa quy trình doanh nghiệp và hợp tác thông minh cá nhân hóa.

Trong bối cảnh đó, Hermes Agent của Nous Research (thường được biết đến trong ngành là "Hermes Agent"), mã nguồn mở vào tháng 2 năm 2026, đã khuấy động cộng đồng nhà phát triển toàn cầu chỉ trong vòng hai tháng, phá vỡ thế độc quyền mã nguồn mở trước đó của OpenClaw và tạo ra một tình huống độc quyền với hai gã khổng lồ cạnh tranh trong ngành.

I. Sự phát triển vượt bậc của lĩnh vực mã nguồn mở đã tạo ra làn sóng di chuyển tác nhân trên toàn bộ lĩnh vực này.

Sự nổi lên của Hermes Agent không phải là một hiện tượng nhất thời, mà là một sự kiện công nghệ mang tính đột phá, trở nên phổ biến nhờ sự kết hợp giữa những tiến bộ công nghệ và những vấn đề nan giải trong ngành. Tính đến ngày 20 tháng 4 năm 2026, dữ liệu về mức độ phổ biến và các sự kiện mang tính bước ngoặt trong ngành có thể được tóm tắt thành bốn nút chính.

Thứ hai, các nhà sản xuất mô hình quy mô lớn trong nước đã và đang tích cực tích hợp natively, mở ra hệ sinh thái ứng dụng trong nước. Xiaomi MiMo-V2, MiniMax, Tencent Cloud và Baidu AI Cloud đã lần lượt công bố việc tích hợp natively vào kiến ​​trúc Hermes Agent, đạt được khả năng tương thích full Chuỗi của cổng mô hình. Các dịch vụ doanh nghiệp trong nước và cộng đồng nhà phát triển đã nhanh chóng tiếp nối với các giải pháp triển khai sở hữu tư nhân, cho phép khung phần mềm mã nguồn mở nước ngoài này nhanh chóng đạt được khả năng bản địa hóa và phá vỡ lời nguyền của ngành rằng các khung phần mềm tác nhân thông minh nước ngoài khó thích ứng với các kịch bản Trung Quốc. Đồng thời, Lark, WeChat Work và DingTalk đã chính thức mở ra khả năng thích ứng giao diện, đạt được khả năng truy cập natively vào các thiết bị đầu cuối IM văn phòng. Tốc độ triển khai trong các kịch bản văn phòng cá nhân và doanh nghiệp vượt xa so với các dự án tương tự cùng thời điểm.

Thứ ba, sự hỗ trợ lẫn nhau từ cộng đồng Web3 và cộng đồng năng suất đang mở rộng ranh giới ứng dụng. Một mặt, các nhà phát triển định lượng đang khám phá các thuộc tính của khung phần mềm đa năng, tận dụng môi trường bảo mật, bộ nhớ dài hạn và khả năng tự gọi API để tạo nền tảng cho việc phát triển lần các robot giao dịch có độ bảo mật cao trong lĩnh vực tài sản crypto . Mặt khác, các nhà phát triển trong lĩnh vực năng suất cá nhân, tự động hóa hoạt động và quy trình doanh nghiệp đang xây dựng các nhân viên kỹ thuật số chuyên dụng trên quy mô lớn, bao gồm nhiều kịch bản khác nhau như tạo nội dung, xử lý dữ liệu, bảo trì hệ thống và điều phối quy trình làm việc, cho phép tái sử dụng nền tảng đa năng trên nhiều lĩnh vực và vượt qua những hạn chế của một công cụ duy nhất.

Thứ tư, sự đồng thuận trong ngành đang được tái cấu trúc, định hình một thế hệ tiêu chuẩn mới cho các tác nhân thông minh đa năng. Khẩu hiệu chính thức của Hermes Agent là "Tác nhân phát triển cùng bạn", và việc ra mắt sản phẩm này đã trực tiếp viết lại định nghĩa của ngành về một tác nhân đa năng: từ một công cụ thực thi lệnh một lần thành một thực thể cộng tác kỹ thuật số lâu dài, hoạt động 24/7, có bộ nhớ bền vững, khả năng tự đánh giá, tự tiến hóa và chủ quyền dữ liệu, thúc đẩy toàn bộ lộ trình công nghệ của ngành từ "gọi công cụ" sang "trí tuệ tự chủ".

II. Một nền tảng tác nhân thông minh tự tiến hóa phổ quát để xây dựng một hệ thống hợp tác khép kín trong mọi tình huống.

Về cơ bản, Hermes Agent không phải là một công cụ chuyên biệt theo chiều dọc, một robot giao dịch không phải là robot gốc, hay một mô hình đối thoại khép kín. Thay vào đó, nó là một khung phần mềm tác nhân thông minh tự động đa năng, toàn diện được phát triển bởi Nous Research bằng Python và phát hành theo giấy phép mã nguồn mở MIT. Mô hình việc kinh doanh của nó được xây dựng dựa trên cấu trúc ba lớp "nền tảng mở + khả năng gốc + mở rộng kịch bản", giải quyết triệt để các vấn đề về phạm vi việc kinh doanh hẹp, khả năng cứng nhắc, triển khai rời rạc và khả năng thích ứng kịch bản kém của các tác nhân truyền thống.

(I) Việc kinh doanh cốt lõi: Hệ điều hành gốc dành cho các tác nhân thông minh

Là nhân hệ điều hành nền tảng, Hermes Agent sở hữu một vòng lặp vận hành tự động hoàn chỉnh: tiếp nhận nhiệm vụ— lập kế hoạch và phân tích tự động — gọi nhiều Chuỗi— thực thi và triển khai nhiệm vụ— phản hồi và xem xét kết quả — lắng đọng và lặp lại khả năng, tạo thành một quy trình việc kinh doanh khép kín không cần sự can thiệp của con người trong toàn bộ Chuỗi . Không giống như các tác nhân truyền thống dựa vào con người để viết tất cả các kịch bản thực thi, các bước được thiết lập trước và các hướng dẫn tinh chỉnh, khung này chỉ yêu cầu người dùng thiết lập các mục tiêu cốt lõi. Nó có thể tự động hoàn thành toàn bộ quá trình lập lịch cho nhiệm vụ phức tạp và dài, bao gồm tất cả các khả năng phổ biến như truy xuất trang web, gọi API, xử lý tệp, lệnh hệ thống, tính toán dữ liệu và tương tác đa nền tảng. Nó đóng vai trò là nền tảng kỹ thuật cho tất cả các ứng dụng lớp trên.

(II) Năng lực việc kinh doanh cấp trung: Hệ thống bộ nhớ phân lớp và kỹ năng tự chủ

Đây là mô-đun khác biệt việc kinh doanh của nó. Khung phần mềm xây dựng kiến ​​trúc bộ nhớ bền vững bốn lớp, sử dụng cơ sở dữ liệu SQLite cục bộ làm lớp lưu trữ. Nó được chia thành bốn mô-đun : bộ nhớ hội thoại tức thời, bộ nhớ lịch sử dài hạn, mô hình ưu tiên người dùng và bộ nhớ kỹ năng thủ tục. Kết hợp với công cụ tìm kiếm toàn văn FTS5, nó có thể truy xuất thông tin chính xác qua nhiều tháng, các cuộc hội thoại và thiết bị đầu cuối, giải quyết triệt để vấn đề nan giải trong ngành là "mất trí nhớ ảo" - xóa bộ nhớ sau khi cuộc hội thoại kết thúc, cắt xén ngữ cảnh và quên thông tin trong các tình huống khác nhau. Đồng thời, nó có vòng lặp việc kinh doanh tự phát triển GEPA tích hợp sẵn. Sau khi hoàn thành nhiệm vụ, nó tự động xem xét quy trình, trích xuất kinh nghiệm, tạo ra các tệp kỹ năng có cấu trúc có thể tái sử dụng và lưu trữ chúng trong thư viện kỹ năng cục bộ. Nhiệm vụ tương tự tiếp theo có thể trực tiếp gọi các tệp này và liên tục tối ưu hóa quy trình, hiện thực hóa việc thực thi như lắng đọng và sử dụng như tăng trưởng, chuyển đổi việc thực thi thụ động thành tích lũy năng lực chủ động.

(III) Việc kinh doanh mở rộng lớp trên: khả năng tương thích mô hình đầy đủ và truy cập kịch bản đa thiết bị đầu cuối

Về khả năng tương thích việc kinh doanh, Hermes Agent tích hợp với hơn 200 giao diện mô hình lớn phổ biến trên toàn cầu, bao gồm sê-ri GPT-4o và Claude 3 ở nước ngoài, các mô hình trong nước như Kimi, MiniMax, Tongyi Qianwen và mô hình mã nguồn mở Ollam. Nó hỗ trợ chuyển đổi mô hình nền tảng liền mạch chỉ bằng một cú nhấp chuột, không bị ràng buộc bởi một nhà cung cấp mô hình duy nhất, mang lại cho người dùng sự lựa chọn mô hình và quyền tự chủ về kỹ thuật. Đối với triển khai trên thiết bị đầu cuối, nó hỗ trợ các hệ thống Windows, macOS và Linux cục bộ, đồng thời thích ứng với nhiều hoàn cảnh triển khai khác nhau như Docker, máy chủ đám mây và VPS cấu hình thấp, cho phép hoạt động nền 24/7. Nó tích hợp với các nền tảng xã hội và văn phòng phổ biến như Lark, WeChat Work, Telegram và Discord, đảm bảo khả năng tương tác dữ liệu bộ nhớ và kỹ năng liền mạch giữa các nền tảng. Điều này cho phép triển khai một lần và tái sử dụng trong mọi trường hợp, đáp ứng nhu cầu đa dạng của cá nhân, nhà phát triển và các doanh nghiệp vừa và nhỏ.

(iv) Xác định ranh giới việc kinh doanh

Cần phải làm rõ ranh giới của các thuộc tính việc kinh doanh: khung phần mềm gốc chính thức không có giao dịch crypto, giao dịch định lượng tài chính, hoặc mô-đun chức năng chuyên biệt theo ngành dọc. Tất cả các khả năng tài chính và chuyên biệt theo ngành đều đến từ việc phát triển kỹ năng lần của cộng đồng. Khung phần mềm chỉ cung cấp một nền tảng thực thi thông minh tổng quát. Tất cả các khả năng dựa trên kịch bản đều dựa trên phần mở rộng nhân hệ điều hành gốc. Nó là một cơ sở hạ tầng tổng quát không ràng buộc kịch bản, chứ không phải là một sản phẩm ứng dụng chuyên biệt theo ngành dọc.

III. Hệ sinh thái thu hút người dùng khách hàng mã nguồn mở và thương mại hóa theo cấp bậc các dịch vụ giá trị gia tăng

Hiện nay, lĩnh vực trợ lý ảo AI nói chung đang đối mặt với những khó khăn trong thương mại hóa như các dự án mã nguồn mã nguồn mở thiếu lợi nhuận, các dự án mã nguồn đóng gặp khó khăn trong việc thu hút người dùng rộng rãi, tỷ lệ giữ chân người dùng thấp và lộ trình kiếm tiền không rõ ràng. Lượng lớn dự án hoặc hoàn toàn miễn phí không có thu nhập hoặc là các dự án mã nguồn đóng với lượng người dùng rất nhỏ, khiến việc hình thành một chu kỳ kinh doanh bền vững trở nên khó khăn. Hermes Agent, dựa trên mô hình kinh doanh hoàn chỉnh của đơn vị phát triển Nous Research, áp dụng mô hình kinh doanh công nghệ mã nguồn mở hoàn thiện, kết hợp mã nguồn mở cốt lõi với quyền truy cập miễn phí và mô hình kiếm tiền giá trị gia tăng ở tầng trên, cân bằng giữa việc mở rộng hệ sinh thái cộng đồng và lợi nhuận thương mại lâu dài, tạo ra một lộ trình rõ ràng và bền vững.

(I) Lớp nền tảng: Khung phần mềm hoàn toàn là mã nguồn mở, cung cấp một nền tảng miễn phí để xây dựng cơ sở người dùng.

Khung vận hành cốt lõi của Hermes Agent hoàn toàn là mã nguồn mở theo giấy phép MIT. Mã nguồn, các công cụ triển khai cơ bản và mô-đun bộ nhớ cơ bản đều hoàn toàn miễn phí và mã nguồn mở, không có bất kỳ hạn chế bản quyền nào, cho phép phát triển lần, sửa đổi sở hữu tư nhân và sử dụng thương mại miễn phí mà không gặp rào cản. Mục tiêu cốt lõi của chiến lược này không phải là lợi nhuận trực tiếp, mà là nhanh chóng chiếm lĩnh thị trường nhà phát triển, lắng đọng cơ sở người dùng toàn cầu và xây dựng một cộng đồng mã nguồn mở. Bằng cách cung cấp một nền tảng miễn phí, nó thu hút một lượng lớn nhà phát triển, hình thành một cơ sở người dùng lớn và cộng đồng phát triển lần, từ đó tạo nền tảng lưu lượng truy cập cho việc kiếm tiền của việc kinh doanh ở tầng trên.

(ii) Lớp giữa: Kiếm tiền từ đăng ký dịch vụ đám mây chính thức, thu nhập giá trị gia tăng cốt lõi

Nous Research đã chính thức ra mắt nền tảng dịch vụ đám mây Nous Portal như một dịch vụ giá trị gia tăng đi kèm với khung phần mềm của mình. Nền tảng này cung cấp cho người dùng quyền truy cập một cửa, không cần cấu hình vào hơn 400 mô hình lớn, vận hành trên đám mây, hỗ trợ tỷ lệ băm đồng thời cao, bảo trì kỹ thuật chính thức, tăng cường bảo mật cấp doanh nghiệp, dữ liệu các dịch vụ sao lưu và lưu trữ trên đám mây, sử dụng mô hình thanh toán thuê bao hàng tháng/hàng năm. Các gói thuê bao nhẹ có sẵn cho người dùng cá nhân, trong khi các gói tùy chỉnh được cung cấp cho người dùng doanh nghiệp. Điều này phục vụ cho những người dùng không thể triển khai cục bộ sở hữu tư nhân và yêu cầu hoạt động đám mây ổn định, và đại diện cho nguồn doanh thu cốt lõi và ổn định nhất của công ty.

(III) Lớp Hệ sinh thái: Thị trường kỹ năng và chia sẻ doanh thu cấp phép hệ sinh thái

Agentskills.io, chính thức, đã được thành lập, tập hợp các kỹ năng chuyên ngành, mẫu quy trình làm việc và plug-in dựa trên kịch bản được phát triển bởi các nhà phát triển trên toàn thế giới. Các kỹ năng trả phí chất lượng cao trên nền tảng này áp dụng mô hình chia sẻ doanh thu giữa chính thức và nhà phát triển. Đồng thời, nó cung cấp giấy phép khung thương mại, điều chỉnh nhân tùy chỉnh và giấy phép triển khai dịch vụ hình ảnh cho các nhà cung cấp đám mây, nhà cung cấp dịch vụ phần mềm doanh nghiệp và nhà cung cấp cơ sở hạ tầng đám mây. Các công ty trong nước như Công ty Khoa học và Công nghệ Vương Tô đã ra mắt dịch vụ hình ảnh đám mây chuyên dụng của họ, hiện thực hóa lợi nhuận thương mại phân khúc B thông qua cấp phép công nghệ.

(iv) Lớp mở rộng: API mô hình và các giải pháp tùy chỉnh cho doanh nghiệp

Tận dụng kho công nghệ mô hình lớn sê-ri mã nguồn mở Hermes đã tích lũy được và kết hợp những ưu điểm của khung tác nhân, công ty cung cấp các API thương mại cho các mô hình lớn và các dịch vụ tùy chỉnh tích hợp kết hợp tác nhân và mô hình. Đối với các doanh nghiệp lớn, công ty cung cấp các dịch vụ dự án tùy chỉnh như triển khai sở hữu tư nhân, tùy chỉnh nhân hệ điều hành độ sâu, thích ứng quy trình việc kinh doanh nội bộ, thiết lập cụm đa tác nhân chuyên dụng và chuyển đổi hệ thống bảo mật, khai phá tiềm năng kinh doanh giá trị cao và bao phủ khả năng kiếm tiền trên tất cả các phân khúc khách hàng, từ cá nhân và doanh nghiệp vừa và nhỏ đến các tập đoàn lớn.

Logic lợi nhuận tổng thể như sau: khung phần mềm mã nguồn mở thu hút người dùng mới và xây dựng hệ sinh thái → dịch vụ đăng ký đám mây cung cấp dòng tiền ổn định → thị trường kỹ năng hệ sinh thái mở rộng lợi nhuận → tùy chỉnh doanh nghiệp khai thác giá trị cao, hoàn toàn tránh được tình trạng khó xử của ngành là phần mềm mã nguồn mở thuần túy không có thu nhập và phần mềm mã nguồn đóng thuần túy không có hệ sinh thái.

IV. Giải quyết những vấn đề cốt lõi của ngành và xây dựng bốn rào cản gia nhập thị trường không thể thay thế.

Trước những thiếu sót phổ biến trong ngành công nghiệp trợ lý ảo đa năng hiện nay, năng lực cạnh tranh cốt lõi của Hermes Agent được xây dựng hoàn toàn dựa trên những điểm yếu ban đầu của ngành. Đây không chỉ đơn thuần là việc bổ sung các chức năng, mà là sự đổi mới ở cấp độ kiến ​​trúc nền tảng, tạo ra bốn rào cản cốt lõi, và đây cũng là lý do cơ bản giúp nó nhanh chóng đạt được thành công.

Thứ nhất, hệ thống bộ nhớ bền vững bốn lớp tích hợp sẵn của nó loại bỏ vấn đề phổ biến "mất trí nhớ ảo" ở các tác nhân đa năng. Hầu hết các tác nhân thông minh truyền thống đều được thiết kế không trạng thái, chỉ dựa vào ngữ cảnh hội thoại ngắn hạn. Tất cả thông tin đều bị mất khi cuộc hội thoại kết thúc, không có bộ nhớ xuyên suốt cuộc hội thoại hoặc lắng đọng tin người dùng dài hạn. Nhiệm vụ lặp đi lặp lại đòi hỏi các hướng dẫn lặp lại. Hermes xây dựng bộ nhớ phân cấp bằng cách sử dụng cơ sở dữ liệu cục bộ, kết hợp với tìm kiếm toàn văn, để lưu trữ dài hạn nhiệm vụ lịch sử , thói quen người dùng và kinh nghiệm thực thi. Càng sử dụng lâu, nó càng hiểu sâu hơn nhu cầu của người dùng, giải quyết hoàn toàn các vấn đề nan giải trong ngành về mất bộ nhớ và phân mảnh ngữ cảnh.

Thứ hai, khả năng tự tiến hóa khép kín của GEPA cho phép tác nhân tự phát triển. Đây là rào cản công nghệ cốt lõi của nó. Hầu hết các tác nhân hiện có dựa trên các quy tắc được định sẵn và thực thi các hướng dẫn một cách máy móc; khả năng của chúng hoàn toàn do con người định nghĩa, thiếu khả năng tự tối ưu hóa hoặc lắng đọng kinh nghiệm, dẫn đến hiệu quả trì trệ trong các nhiệm vụ lặp đi lặp lại. Tuy nhiên, Hermes tích hợp một chu trình xem xét và tiến hóa hoàn chỉnh, tự động tóm tắt nhiệm vụ, tạo ra các kỹ năng, lặp lại các quy trình và tự vá lỗi. Mỗi lần thực thi nhiệm vụ đều dẫn đến sự gia tăng khả năng của chính nó, khiến nó mạnh mẽ hơn khi được sử dụng. Điều này đánh dấu lần đầu tiên trong lĩnh vực mã nguồn mở, khả năng tự tiến hóa của một tác nhân được thiết kế và triển khai.

Thứ ba, nó cung cấp khả năng tương thích hoàn toàn với mô hình và nền tảng, cùng với quyền tự chủ dữ liệu sở hữu tư nhân mạnh mẽ. Hầu hết các khung công nghệ trong ngành đều gắn độ sâu với một mô hình lớn duy nhất, khiến người dùng bị ràng buộc vào công nghệ của nhà cung cấp và tiềm ẩn rủi ro vi phạm quyền riêng tư do dữ liệu được tải lên các dịch vụ đám mây của bên thứ ba. Hermes loại bỏ các rào cản ràng buộc mô hình, tương thích liền mạch với nhiều mô hình lớn trên toàn cầu; tất cả dữ liệu về bộ nhớ, nhiệm vụ và kỹ năng đều được lưu trữ cục bộ, không cần tải lên các dịch vụ đám mây của bên thứ ba, đảm bảo quyền tự chủ dữ liệu hoàn toàn cho người dùng. Kết hợp với hộp cát bảo mật năm lớp, phê duyệt cho các hoạt động nguy hiểm và bảo vệ cách ly vùng chứa, nó giải quyết các vấn đề liên quan đến ràng buộc mô hình, bảo mật dữ liệu và vi phạm quyền riêng tư.

Thứ tư, nó nhẹ, ổn định và có thể chạy liên tục, với ngưỡng triển khai thấp và khả năng thích ứng với nhiều kịch bản khác nhau. So với việc triển khai phức tạp và chi phí tỷ lệ băm cao của các tác nhân doanh nghiệp nặng nề, và các vấn đề của nhiệm vụ nhẹ dễ bị lỗi và không thể chạy ngầm cho các tác vụ phức tạp, Hermes có thể đạt được hoạt động nền ổn định 24/7 trên VPS cấu hình thấp và có thể được triển khai nhanh chóng chỉ với một lệnh duy nhất, cân bằng giữa sự tiện lợi khi triển khai và tính ổn định của việc thực thi nhiệm vụ lâu dài. Đồng thời, cơ chế kích hoạt theo yêu cầu của việc gọi công cụ giúp giảm đáng kể các ảo tưởng về mô hình và cân bằng giữa tính linh hoạt khi thực thi với độ tin cậy hoạt động.

V. Hệ sinh thái mã nguồn mở phi tập trung , được thúc đẩy bởi cả nền tảng mở và sự hợp tác cộng đồng.

Hermes Agent áp dụng mô hình hệ sinh thái mã nguồn mở phi tập trung , dẫn đầu bởi nhân kernel chính thức , được cộng đồng toàn cầu cùng phát triển và tương thích rộng rãi với cả thượng nguồn và hạ nguồn. Điều này khác biệt so với hệ sinh thái nền tảng plug-in tập trung của OpenClaw và hệ sinh thái khép kín, sở hữu tư nhân của các công ty lớn. Hermes Agent xây dựng một hệ sinh thái mở và cùng có lợi, giải quyết các vấn đề của hệ sinh thái tác nhân thông minh khép kín, kỹ năng đồng nhất và sự phân mảnh giữa thượng nguồn và hạ nguồn.

(I) Hệ sinh thái lớp hạt nhân: Đội ngũ chính thức bảo vệ ranh giới của nền tảng cơ bản

Nous Chính thức chỉ tập trung vào việc cải tiến công nghệ nền tảng, tối ưu hóa kiến ​​trúc bộ nhớ, nâng cấp hệ thống bảo mật và điều chỉnh cổng mô hình cho phù hợp với lớp nền tảng. Công ty không độc quyền các ứng dụng lớp trên, không hạn chế phát triển kỹ năng, cũng không ép buộc người dùng sử dụng mô hình riêng của họ. Nous Research liên tục duy trì sự ổn định của khung nền tảng và cập nhật các khả năng cơ bản, giữ cho nhân hệ điều hành mã mã nguồn mở mở và cung cấp nền tảng kỹ thuật ổn định cho toàn bộ hệ sinh thái.

(II) Hệ sinh thái cấp nhà phát triển: Cộng đồng toàn cầu lần và đồng sáng tạo

Dựa trên giấy phép mã nguồn mở, các nhà phát triển cá nhân và đội ngũ kỹ thuật trên toàn thế giới có thể tự do phát triển các kỹ năng theo kịch bản, mẫu quy trình làm việc, plug-in ngành và giải pháp thích ứng thiết bị đầu cuối dựa trên nhân hệ điều hành. Tất cả các kỹ năng chính thức đều do cộng đồng đóng góp lắng đọng, tạo thành một nguồn tài nguyên ứng dụng khổng lồ và đa dạng. Các nhà phát triển trong các lĩnh vực như năng suất cá nhân, phát triển vận hành và bảo trì, tự động hóa văn phòng, định lượng Web3 và phân tích dữ liệu tiếp tục làm phong phú thêm hệ sinh thái. Chính thức chỉ thực hiện kiểm tra an ninh và không hạn chế hướng phát triển, đạt được nền tảng thống nhất và một hệ sinh thái ứng dụng phát triển mạnh mẽ.

(III) Hệ sinh thái tương thích thượng nguồn và hạ nguồn: hợp tác đa khuôn khổ và tiếp cận nhà cung cấp

Hệ sinh thái này rất mở và có thể cộng tác với các khung phần mềm tác nhân thông minh khác. Một mô hình chung của ngành đã xuất hiện, trong đó Hermes được sử dụng để lập kế hoạch nhiệm vụ cấp cao và OpenClaw long kênh. Hai khung phần mềm hàng đầu này bổ sung cho nhau thay vì cạnh tranh theo kiểu "được ăn cả, thua mất tất cả", phá vỡ các rào cản trong ngành đối với sự hợp tác công nghệ. Đồng thời, các nhà cung cấp dịch vụ đám mây, nền tảng văn phòng IM, các nhà cung cấp mô hình lớn và các nhà cung cấp dịch vụ tỷ lệ băm đều đã tích hợp và thích ứng, tạo ra một Chuỗi hoàn chỉnh trong ngành, kết nối toàn bộ Chuỗi từ cung cấp mô hình, hỗ trợ tỷ lệ băm , truy cập thiết bị đầu cuối và triển khai ứng dụng.

(iv) Vòng khép kín giá trị sinh thái

Khung nền tảng cơ bản mã nguồn mở → các nhà phát triển cùng nhau tạo ra các kỹ năng và ứng dụng → người dùng sử dụng nó trong nhiều tình huống khác nhau → phản hồi của người dùng được đưa vào các phiên bản cải tiến của nhân hệ điều hành → nhiều nhà cung cấp kết nối hoàn thiện cơ sở hạ tầng → thu hút thêm nhiều nhà phát triển tham gia, hình thành một hệ sinh thái tuần hoàn tích cực, thoát khỏi sự phụ thuộc vào một dự án duy nhất và đạt được sự tự phát triển của hệ sinh thái.

VI. Hai người chơi hàng đầu trong ngành đang tham gia vào một cuộc cạnh tranh khác biệt, với những chiến lược rõ ràng trái ngược nhau.

Hiện nay, thị trường tác nhân thông minh mã mã nguồn mở mở toàn cầu đang bị chi phối bởi Hermes Agent và OpenClaw, đồng thời cạnh tranh với các sản phẩm tác nhân thông minh mã nguồn đóng như Claude Code và OpenAI Codex. Phương pháp tiếp cận, khả năng và kịch bản ứng dụng của mỗi sản phẩm đều khác biệt đáng kể. Một so sánh toàn diện theo chiều ngang có thể cho thấy rõ vị trí và ranh giới giá trị tương ứng của chúng.

(a) Các đối thủ cạnh tranh chính: Hermes Agent VS OpenClaw (Lobster)

Hai công nghệ này đại diện cho hai hướng phát triển công nghệ hoàn toàn khác nhau trong ngành. Chúng không phải là sự thay thế hay cạnh tranh toàn diện, mà là sự bổ sung cho nhau về khả năng. Bảng so sánh chi tiết như sau:

Định vị cốt lõi: Hermes là một công cụ thông minh tự phát triển, tập trung vào sự tự trưởng thành của tác nhân, khả năng thực thi độ sâu và lắng đọng kinh nghiệm; OpenClaw là một nền tảng lập lịch cổng đa kênh, tập trung vào truy cập đa thiết bị đầu cuối, phân phối nhiệm vụ và quản lý liên kết công cụ. Nói theo ngôn ngữ chuyên ngành: OpenClaw quản lý các kênh đầu vào, Hermes quản lý bộ não thông minh.

Hệ thống bộ nhớ: Hermes sử dụng bộ nhớ cơ sở dữ liệu cục bộ bốn lớp để truy xuất thông tin xuyên tháng và mô hình hóa người dùng dài hạn; OpenClaw chỉ dựa vào bộ nhớ ngắn hạn dựa trên tệp, không có bộ nhớ dài hạn gốc, bị lỗi quên nghiêm trọng giữa các phiên và không có mối tương quan tích cực giữa thời gian sử dụng và khả năng.

Cơ chế kỹ năng: Hermes tự động tạo ra và lặp lại các kỹ năng sở hữu tư nhân , lắng đọng khả năng từ nhiệm vụ ; OpenClaw dựa vào plug-in được thiết lập sẵn được tải lên thủ công, với tất cả các kỹ năng đến từ thị trường cộng đồng, và có lượng lớn rủi ro bảo mật plug-in độc hại.

Mô hình và Triển khai: Hermes cung cấp khả năng tương thích liền mạch trên tất cả các mô hình, triển khai cục bộ sở hữu tư nhân với bảo mật dữ liệu cao; OpenClaw tự hào có một hệ sinh thái plug-in phong phú và nhiều kênh truy cập, nhưng phụ thuộc nhiều vào hoạt động trên đám mây, tiềm ẩn rủi ro rò rỉ dữ liệu cao và dễ bị sập trong nhiệm vụ phức tạp.

Các trường hợp áp dụng: Hermes phù hợp cho các đối tác kỹ thuật số cá nhân lâu dài, các quy trình sở hữu tư nhân của doanh nghiệp, tự động hóa thường xuyên các hoạt động và bảo trì, và nhiệm vụ phức tạp đòi hỏi sự phát triển liên tục; OpenClaw phù hợp cho nhiệm vụ nhẹ, thực hiện một lần, lập lịch tin nhắn đa nền tảng, phát triển nguyên mẫu nhanh và gọi các công cụ lập trình nhẹ.

(ii) So sánh với các sản phẩm cạnh tranh khác

Mã Claude: Một tác nhân thông minh độc quyền, hệ thống khép kín với hiệu quả thực thi cao nhưng bị ràng buộc độ sâu bởi mô hình Nhân sinh. Nó không có quyền lựa chọn mô hình, không có bộ nhớ dài hạn hoặc khả năng tự tiến hóa, chỉ phục vụ hệ sinh thái của riêng mình và có tính linh hoạt cực kỳ kém.

OpenAI Codex tập trung vào các tác nhân thông minh dành riêng cho lĩnh vực lập trình, với khả năng điều khiển cấp hệ thống mạnh mẽ, nhưng nó bị giới hạn trong các kịch bản chuyên ngành, thiếu các khả năng năng suất tổng quát, là mã nguồn đóng và tính phí, đồng thời có rào cản thương mại hóa cao.

Các tác nhân nội địa mã nguồn đóng: Hầu hết dựa vào các mô hình lớn riêng của chúng để phát triển khép kín, dẫn đến hệ sinh thái khép kín, khả năng tương thích kém, chi phí tùy chỉnh cao, không có nền tảng mã mã nguồn mở và khó khăn trong việc mở rộng lần.

Tóm lại, Hermes dẫn đầu ở mọi khía cạnh, bao gồm bộ nhớ dài hạn, khả năng tự tiến hóa, bảo mật dữ liệu, khả năng tương thích mô hình và triển khai sở hữu tư nhân; OpenClaw có ưu điểm về hệ sinh thái plug-in, số lượng kênh, dễ sử dụng và tốc độ thực thi nhanh; các tác nhân thông minh thương mại đóng bị giới hạn trong hệ sinh thái của riêng chúng và tính linh hoạt kém hơn nhiều so với hai gã khổng lồ mã nguồn mở.

VII. Công nghệ này chưa hoàn thiện và vẫn còn nhiều thiếu sót trong ứng dụng công nghiệp.

Mặc dù Hermes Agent đã có những bước đột phá trong việc giải quyết nhiều vấn đề cốt lõi trong ngành và sở hữu những khả năng tổng thể vượt trội, nhưng với tư cách là một khung phần mềm thế hệ mới chỉ ra mắt được hai tháng, nó vẫn còn gặp phải những thiếu sót đáng kể về mặt kỹ thuật, những khiếm khuyết trong hệ sinh thái và những thách thức trong việc triển khai thực tế, dẫn đến những hạn chế đáng kể trong sự phát triển của ngành.

Thứ nhất, phiên bản dự án còn khá mới và độ hoàn thiện kỹ thuật tổng thể chưa đủ. Hiện tại, nó mới chỉ được cập nhật lên phiên bản v0.8, và nhân hệ điều hành vẫn đang trong giai đoạn phát triển nhanh chóng. Độ ổn định của một số nhiệm vụ phức tạp và Chuỗi dài chưa đủ, logic lập kế hoạch dễ bị sai lệch trong các tình huống cực đoan, và khả năng hợp tác của các cụm đa tác nhân phức tạp vẫn chưa hoàn thiện. Vẫn còn nhiều dư địa để tối ưu hóa trước khi nó có thể đạt được hoàn cảnh sản xuất quy mô lớn, độ tin cậy cao ở cấp doanh nghiệp.

Thứ hai, hệ sinh thái plug-in gốc của Hermes tụt hậu xa so với OpenClaw. OpenClaw có một thị trường plug-in hoàn thiện với rất nhiều công cụ và tài nguyên sẵn có sau thời gian dài phát triển; hệ sinh thái của Hermes chủ yếu dựa trên các kỹ năng do cộng đồng phát triển, với ít plug-in đa năng sẵn có, phạm vi bao phủ các trường hợp sử dụng không đủ, thiếu tài nguyên cho người mới bắt đầu sử dụng ngay lập tức, và cần một khoản chi phí phát triển lần nhất định để sử dụng ban đầu.

Thứ ba, chi phí suy luận tương đối cao và tốc độ thực thi tương đối chậm. Bị ảnh hưởng bởi hệ thống bộ nhớ đa lớp, mô-đun xem xét và phát triển tự động, và cơ chế xác minh hộp cát bảo mật, tỷ lệ băm của một nhiệm vụ đơn lẻ cao hơn, và tốc độ thực thi của nhiệm vụ ngắn đơn giản chậm hơn so với các khung cổng nhẹ, khiến nó kém hiệu quả hơn trong các kịch bản nhẹ.

Thứ tư, có vấn đề về sự dư thừa thư viện kỹ năng và gánh nặng truy xuất. Khi sử dụng lâu dài, số lượng kỹ năng lắng đọng cục bộ tiếp tục tăng lên, dễ dẫn đến sự dư thừa kỹ năng, xung đột gọi hàm và giảm hiệu quả truy xuất. Khung phần mềm vẫn chưa hoàn thiện cơ chế đơn giản hóa kỹ năng thông minh và cơ chế tự động dọn dẹp các kỹ năng đã hết hạn, tăng chi phí vận hành và bảo trì lâu dài.

Thứ năm, những thách thức chung trong toàn ngành vẫn chưa được giải quyết triệt để. Những điểm yếu chung của ngành, chẳng hạn như ảo tưởng về các mô hình cơ bản quy mô lớn, tính khó hiểu của các quy trình ra quyết định phức tạp, chuỗi dài và khả năng thích ứng hạn chế với việc kinh doanh liên ngành phức tạp, vẫn chưa được giải quyết. Hơn nữa, tỷ lệ triển khai các tác nhân AI quy mô công nghiệp toàn cầu còn thấp, khiến các công ty khó đạt được lợi tức đầu tư (ROI), và việc áp dụng rộng rãi hệ sinh thái này vẫn bị hạn chế bởi hoàn cảnh ngành rộng lớn hơn.

Thứ sáu, rủi ro nhầm lẫn do các dự án có cùng tên và vấn đề lạm dụng ranh giới ứng dụng. Trên toàn mạng có các bot giao dịch crypto và các dự án giao thức Chuỗi có cùng tên, điều này dễ gây nhầm lẫn cho người dùng; đồng thời, một số người dùng lạm dụng khả năng API của khung phần mềm để thực hiện các giao dịch tiền ảo, vượt qua các ranh giới quy định và gây ra rủi ro tuân thủ ứng dụng.

8. Từ các đối tác kỹ thuật số cá nhân đến cơ sở hạ tầng thông minh đa năng phân tán

Bằng cách kết hợp sự cải tiến công nghệ, mở rộng hệ sinh thái và xu hướng ngành, đồng thời tận dụng những lợi thế kiến ​​trúc vốn có, Hermes Agent có một lộ trình phát triển rõ ràng trong tương lai. Nó sẽ phát triển theo bốn hướng chính: hoàn thiện công nghệ, mở rộng hệ sinh thái, làm sâu sắc thêm các kịch bản và phổ biến trong ngành, liên tục mở rộng phạm vi giá trị của các tác nhân thông minh đa năng.

Trước tiên, công nghệ nhân lõi sẽ tiếp tục được cải tiến, khắc phục mọi thiếu sót về độ hoàn thiện. Các phiên bản tiếp theo sẽ tập trung vào tối ưu hóa tính ổn định của việc lập kế hoạch nhiệm vụ phức tạp, giảm chi phí tỷ lệ băm suy luận, hoàn thiện cơ chế quản lý kỹ năng thông minh, tăng cường khả năng hợp tác cụm đa tác nhân và cải thiện khả năng chịu lỗi và cơ chế hoàn tác cho nhiệm vụ chạy dài, dần dần đạt được các tiêu chuẩn sản xuất độ tin cậy cao cấp doanh nghiệp và thu hẹp khoảng cách giữa ngành từ "có thể sử dụng" và "đáng tin cậy". Đồng thời, hệ thống bảo mật sẽ được tăng cường, hoàn thiện kiểm toán đầu cuối, kiểm soát truy cập và ngăn chặn rủi ro, thích ứng với các yêu cầu tuân thủ của các ngành nhạy cảm cao như tài chính và chính phủ.

Thứ hai, hệ sinh thái tiếp tục mở rộng, đạt được hoàn thiện lẫn nhau cả về cộng đồng và bản địa hóa. Một mặt, nó làm phong phú thêm thư viện kỹ năng chính thức và cộng đồng, bổ sung các nguồn tài nguyên ứng dụng có sẵn và thu hẹp khoảng cách với các hệ sinh thái khung phần mềm hàng đầu. Mặt khác, nó tiếp tục làm sâu sắc thêm khả năng thích ứng với bối cảnh Trung Quốc, tích hợp độ sâu với hệ sinh thái văn phòng trong nước và hệ thống số hóa doanh nghiệp, hoàn thiện khả năng tương thích gốc Chuỗi đầy đủ của các mô hình quy mô lớn trong nước và hoàn thành việc bản địa hóa toàn diện. Đồng thời, nó làm sâu sắc thêm hệ sinh thái hợp tác đa khung phần mềm, hình thành một hệ thống hợp tác ngành bổ sung và phân công lao động với các khung phần mềm như OpenClaw, cùng nhau thúc đẩy sự phát triển tổng thể của ngành công nghiệp phần mềm mã nguồn mở .

Thứ ba, các kịch bản ứng dụng đang mở rộng từ năng suất cá nhân đến triển khai trên toàn doanh nghiệp trong tất cả các ngành. Ban đầu, nó tập trung vào trợ lý kỹ thuật số cá nhân, công cụ dành cho nhà phát triển và tự động hóa vận hành và bảo trì đơn giản; trong trung hạn, nó thâm nhập hoàn toàn vào tự động hóa quy trình của các doanh nghiệp vừa và nhỏ, nhân viên kỹ thuật số nội bộ và xử lý dữ liệu việc kinh doanh ; trong dài hạn, nó tiến vào triển khai các tác nhân thông minh sở hữu tư nhân trong các doanh nghiệp lớn, đảm nhiệm lập lịch hệ thống nội bộ, thực thi tự động các quy trình việc kinh doanh và cộng tác dữ liệu giữa các hệ thống, trở thành cơ sở hạ tầng thông minh nền tảng cho chuyển đổi số của doanh nghiệp.

Thứ tư, làm sâu sắc thêm mô hình kinh doanh và xây dựng một vòng khép kín kinh doanh mã nguồn mở hoàn chỉnh. Dựa trên các dịch vụ đăng ký, cấp phép và tùy chỉnh hiện có, hoàn thiện hệ thống chia sẻ doanh thu thị trường kỹ năng, mở rộng mô hình kinh doanh mới về mạng lưới tỷ lệ băm phân tán kết hợp với khung phần mềm, và kết hợp công nghệ mô hình của riêng chúng tôi để tạo ra một dịch vụ tích hợp toàn diện "mô hình lớn + tác nhân thông minh + tỷ lệ băm" nhằm hình thành một hệ thống kinh doanh bền vững và tăng trưởng cao, xác minh tính khả thi thương mại hóa của các tác nhân thông minh mã nguồn mở nói chung, và cung cấp một mô hình thương mại cho toàn ngành.

Thứ năm, hướng tới một cơ sở hạ tầng thông minh đa năng phân tán. Về lâu dài, khi công nghệ hợp tác đa tác nhân trưởng thành, Hermes sẽ phát triển từ một khung tác nhân đơn lẻ thành một lõi mạng thông minh phân tán dành cho cá nhân và doanh nghiệp. Với khả năng tự tiến hóa và bộ nhớ dài hạn làm cốt lõi, nó sẽ kết nối nhiều phần mềm, phần cứng và hệ thống việc kinh doanh khác nhau, trở thành nền tảng thông minh đa năng của thế giới kỹ thuật số thế hệ tiếp theo và đảm nhận các nhu cầu hợp tác quy mô lớn trong giai đoạn đầu triển khai Trí tuệ Nhân tạo Tổng quát (AGI).

Năm 2026, cuộc cạnh tranh trong lĩnh vực tác nhân thông minh AI sẽ không còn là cuộc đua hời hợt về số lượng công cụ và plug-in , mà là một cuộc cách mạng độ sâu trong lĩnh vực này, bao gồm kiến ​​trúc nền tảng, khả năng bộ nhớ, trí thông minh tự chủ, bảo mật dữ liệu và hệ sinh thái kinh doanh. Nhìn vào toàn ngành, phần lớn các tác nhân thông minh đa năng vẫn đang mắc kẹt trong nghịch lý cơ bản là "có khả năng giao tiếp nhưng khó thực thi, thiếu bộ nhớ, không thể phát triển và khó triển khai", chỉ đơn thuần là đóng gói các khả năng của mô hình lớn mà không chạm đến giá trị cốt lõi thực sự của tác nhân thông minh.

Sự trỗi dậy của Hermes Agent về cơ bản là sự trở lại với giá trị của kiến ​​trúc. Thay vì chỉ đơn thuần chồng chất các công cụ và giao diện, nó giải quyết chính xác năm điểm yếu cốt lõi của ngành: mất bộ nhớ, không có khả năng phát triển, mất an toàn dữ liệu, ràng buộc mô hình và khả năng thương mại hóa không rõ ràng. Với nhân tự phát triển, bộ nhớ bền vững nhiều lớp, khả năng tương thích mô hình đầy đủ, bảo mật sở hữu tư nhân và một hệ sinh thái kinh doanh mã nguồn mở lành mạnh, nó định nghĩa lại tiêu chuẩn sản phẩm cho các tác nhân thông minh đa năng. Nó không chỉ giải quyết nhu cầu công cụ của một kịch bản duy nhất, mà còn giải quyết các vấn đề mang tính hệ thống của các tác nhân thông minh đa năng trong toàn ngành: "thực thi mà không tích lũy, đối thoại mà không có trí tuệ, khung mà không có hệ sinh thái và sản phẩm không có khả năng thương mại".

Dĩ nhiên, con đường đạt đến sự trưởng thành về công nghệ còn dài và gian nan, và dự án vẫn còn đối mặt với nhiều thách thức chưa được giải quyết liên quan đến hệ sinh thái, tốc độ và tính ổn định. Tuy nhiên, từ góc độ phát triển ngành, Hermes Agent đã mở ra một con đường mới cho sự phát triển của các tác nhân thông minh đa năng, khác biệt với con đường lập lịch cổng kết nối. Với cốt lõi là "cùng phát triển với người dùng", nó thúc đẩy AI chuyển đổi từ một công cụ đối thoại đơn lẻ thành một người bạn đồng hành lâu dài, tự động phát triển và là đối tác kỹ thuật số cộng tác độ sâu. Điều này cung cấp một mô hình mới và khả thi cho việc triển khai quy mô lớn và ứng dụng rộng rãi các tác nhân thông minh AI trong dân sự trên toàn cầu, đồng thời đặt nền tảng mã nguồn mở vững chắc cho việc xây dựng cơ sở hạ tầng trí tuệ nhân tạo đa năng thế hệ tiếp theo.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận