Hermes là gì? Trợ lý AI tự cải tiến sắp ra mắt trên OpenClaw.

04-15

Bài viết này được dịch máy

Xem bản gốc

Lĩnh vực trí tuệ nhân tạo (AI) vừa có thêm một ứng cử viên mới, và nó đang học hỏi nhanh hơn bất kỳ ai dự đoán. Hermes Agent , được xây dựng bởi Nous Research, ra mắt dưới dạng một tác nhân tự động mã nguồn mở, không chỉ thực hiện các nhiệm vụ mà còn tự cải thiện mỗi khi hoạt động.

Kể từ khi ra mắt, Hermes đã thu hút hơn 5.000 lượt đánh dấu sao trên GitHub và gây ra một cuộc tranh luận chia rẽ cộng đồng những người đam mê trí tuệ nhân tạo: Liệu nó thực sự tốt hơn OpenClaw ?

Câu trả lời Short là: khá phức tạp. Câu trả lời dài hơn liên quan đến việc hiểu rõ mục đích thiết kế của từng công cụ và tại sao việc sử dụng cả hai có thể là giải pháp tối ưu.

Hermes Agent là một tác nhân AI tự động mã nguồn mở được xây dựng bởi Nous Research, được thiết kế để học hỏi theo thời gian thay vì bắt đầu lại từ đầu trong mỗi phiên. Nous đã xây dựng dòng mô hình Hermes-3 được huấn luyện trên Llama 3.1 với bộ công cụ Atropos RL của họ.

Phần mềm này được tích hợp sẵn 47 công cụ , một hệ thống bộ nhớ bền vững có thể mở rộng qua các phiên làm việc, kiến trúc bộ nhớ phụ trợ có thể cắm thêm, tích hợp máy chủ MCP , hỗ trợ chế độ thoại trên tất cả các nền tảng, và – đây là tính năng nổi bật nhất – một hệ thống kỹ năng cho phép phần mềm tạo, cập nhật và xóa các quy trình của riêng mình.

Vì vậy, khi Hermes tìm ra một quy trình làm việc phức tạp, nó sẽ lưu lại phương pháp đó dưới dạng tài liệu kỹ năng có thể tái sử dụng. Bạn càng sử dụng nó nhiều, nó càng trở nên mạnh mẽ hơn, và đây chính là điểm khác biệt cốt lõi.

Phiên bản mới nhất đã bổ sung tính năng tự động thông báo tác vụ nền, cung cấp MiMo v2 Pro miễn phí trên Nous Portal và chuyển đổi mô hình trực tiếp trên tất cả các nền tảng. Nó hỗ trợ Claude, ChatGPT, Qwen và các mô hình mã nguồn mở cục bộ. Điều đó có nghĩa là người dùng có thể chạy hoàn toàn trên Qwen 3.5 cục bộ, điều mà cộng đồng mô hình mã nguồn mở đã và đang thực hiện với kết quả khả quan.

Việc so sánh với OpenClaw là điều không thể tránh khỏi nhưng thường bị hiểu sai. OpenClaw và Hermes Agent giải quyết các vấn đề chồng chéo nhau nhưng có triết lý hoàn toàn khác biệt.

OpenClaw đặt hệ sinh thái lên hàng đầu — nó được xây dựng để tích hợp với mọi thứ, và nguồn lực phát triển khổng lồ của nó (được hỗ trợ bởi việc OpenAI mua lại người sáng lập Peter Steinberger và sự hỗ trợ phát triển đáng kể từ Nvidia) cho phép nó phát hành các bản cập nhật hàng ngày với hỗ trợ plugin gốc cho Cursor, Claude Code và các IDE khác (đó là môi trường phát triển tích hợp, dành cho những người chưa quen với thuật ngữ này).

Hermes lấy việc học hỏi làm trọng tâm—toàn bộ kiến trúc của nó xoay quanh việc tác nhân tự cải thiện thông qua quá trình sử dụng. Vòng lặp tự cải thiện không phải là một tính năng được thêm vào sau; đó chính là lý do tồn tại của dự án.

Tóm lại, OpenClaw sử dụng trí tuệ nhân tạo để trở thành người đa năng. Hermes hướng đến mục tiêu trở thành người giỏi nhất tuyệt đối trong một lĩnh vực nào đó sau một vài lần cải tiến.

Trong các thử nghiệm của chúng tôi, Hermes hoạt động nhanh hơn OpenClaw, ngay cả trên cùng một mô hình. Kiến trúc nhẹ của tác nhân này, với màn hình thiết bị đầu cuối đơn giản, giúp giảm độ trễ khi gọi công cụ, thời gian phản hồi nhanh hơn và ít tốn tài nguyên hơn.

Trước đây OpenClaw đã từng gặp phải các vấn đề về hiệu năng, và nhóm phát triển đang nỗ lực khắc phục. Còn Hermes thì luôn hoạt động nhanh nhạy.

Tuy nhiên, OpenClaw là một dự án lớn hơn nhiều, được sử dụng bởi nhiều người hơn và ghi lại nhiều trường hợp hơn.

OpenClaw đã đầu tư mạnh vào kiến trúc subagent—tạo ra các agent chuyên biệt cho các nhiệm vụ cụ thể. Hermes hỗ trợ Giao thức Truyền thông Agent (ACP), cho phép nó giao tiếp trực tiếp với OpenClaw hoặc các agent khác, nhưng điều phối không phải là trọng tâm của nó.

Kết quả thực tiễn: Bạn có thể chạy cả hai song song, với OpenClaw điều phối và Hermes thực thi, hoặc cho chúng hoạt động trên các phần khác nhau của dự án cùng một lúc. Claude ở giao diện người dùng, ChatGPT ở phía máy chủ, cả hai cùng hoạt động song song.

OpenClaw là một trình điều phối tốt, phân công nhiệm vụ cho các tác nhân khác nhau, trong khi Hermes là một trình thực thi độc lập xuất sắc.

Nếu bạn là người dùng thành thạo, bạn có thể sử dụng cả hai cùng lúc. Nếu bạn chỉ cần một thứ gì đó thiết thực, quyết định của bạn sẽ phụ thuộc vào mục đích sử dụng trợ lý AI của mình.

Đây là điểm mà triết lý của hai hệ thống khác biệt rõ rệt. OpenClaw bắt đầu như một lớp trung gian, cung cấp cho bạn một tác nhân "thô sơ" mà bạn phải tự định hình theo ý muốn và làm cho nó mạnh mẽ như bạn mong muốn dựa trên tất cả các kỹ năng bạn cài đặt.

Điều này thường có nghĩa là bạn hoặc mô hình sẽ truy cập vào kho lưu trữ các "kỹ năng" được cấu hình sẵn do người dùng khác tạo ra và chia sẻ với cộng đồng.

Hermes được tích hợp sẵn các công cụ học tập, giúp người dùng dễ dàng sử dụng ngay từ đầu. Nó cũng hỗ trợ định dạng kỹ năng, cho phép bạn yêu cầu mô hình học một kỹ năng cụ thể.

Tuy nhiên, không giống như OpenClaw, chương trình nhẹ này có khả năng tạo và chỉnh sửa các kỹ năng của riêng nó khi bạn tương tác với nó. Ví dụ, chúng tôi yêu cầu mô hình truy cập vào tài khoản của mình. Nó đã hợp tác với chúng tôi trong suốt quá trình và sau khi thành công, nó đã tự tạo ra kỹ năng của riêng mình thay vì dựa vào kỹ năng đã được viết sẵn từ bên thứ ba.

Đối với người dùng mới, việc mô hình tự tạo ra kỹ năng riêng có nghĩa là họ không phải tiếp xúc với các kỹ năng của bên thứ ba tiềm ẩn nguy hiểm, có thể chèn lời nhắc hoặc thực hiện những hành động kỳ lạ khác. Đối với người dùng nâng cao hơn, điều đó có nghĩa là trợ lý ảo của họ có thể sở hữu quy trình làm việc, kiến thức và hành vi phù hợp hơn với tính cách và yêu cầu của họ.

Cả hai đều hỗ trợ Telegram, Slack, Discord, WhatsApp và giao diện dòng lệnh cùng nhiều nền tảng nhắn tin khác. OpenClaw có khả năng tích hợp gốc hoàn thiện hơn với các công cụ phát triển. Hermes có nhiều tùy chọn triển khai linh hoạt hơn—nó chạy trên mọi thứ từ Raspberry Pi đến cụm máy chủ đám mây, và giải pháp không máy chủ hầu như không tốn chi phí khi ở trạng thái nh闲 rỗi.

Cả hai đều là mã nguồn mở hoàn toàn và miễn phí. Chi phí duy nhất của bạn là các cuộc gọi API đến mô hình bạn sử dụng và cơ sở hạ tầng để lưu trữ nó, hoặc chi phí điện năng nếu bạn chọn chạy mô hình cục bộ.

Tài liệu của OpenClaw được hưởng lợi từ đội ngũ lớn hơn và lịch sử phát triển lâu dài hơn.

Tài liệu hướng dẫn của Hermes được cấu trúc và chức năng tốt—bao gồm cài đặt, khởi động nhanh, cấu hình, công cụ, bộ nhớ, kỹ năng, tích hợp MCP và chế độ thoại—nhưng cách viết lại giống như được viết bởi các kỹ sư dành cho các kỹ sư. Nó thiếu sự hướng dẫn chi tiết.

Tuy nhiên, cả hai đều đã được cải thiện theo thời gian và việc sửa lỗi không còn là vấn đề khó khăn nữa, đặc biệt là khi xét đến mức độ tương tác tích cực của cộng đồng người dùng.

OpenClaw sở hữu cộng đồng lớn hơn và tài liệu phong phú hơn, nhờ vào đội ngũ phát triển đông đảo và kinh nghiệm lâu năm. Thêm vào đó, do tầm ảnh hưởng văn hóa rộng lớn, nhiều công ty đang xây dựng các dự án dựa trên nền tảng này, giúp việc vận hành trở nên dễ dàng hơn.

Hiện tại, Xiaomi có MiMo Claw, Minimax có MaxClaw, Ziphu AI có AutoClaw, ETC Ngay cả Nvidia cũng cung cấp giải pháp OpenClaw cho mục đích doanh nghiệp. Bạn sẽ không thấy điều đó với Hermes, ít nhất là chưa.

Các giải pháp này cho phép người dùng chạy một phiên bản đám mây, triển khai các tác nhân chỉ bằng một nút bấm. Việc tương tác với một tác nhân đám mây chạy trên một máy riêng biệt có thể bị hạn chế hơn một Bit so với việc cấp quyền truy cập cho tác nhân trên máy tính cục bộ của bạn, nhưng vẫn là một lựa chọn rất mạnh mẽ dành cho người dùng thông thường.

Hermes đang phát triển nhanh chóng—máy chủ Discord của nó hoạt động sôi nổi, tài liệu hướng dẫn đầy đủ và ngày càng được cải thiện, và cộng đồng nghiêng về những người thích mày mò kỹ thuật và thường xuyên đóng góp. Nhưng cuối cùng, nó vẫn chỉ là một trình giả lập terminal tốt mà thôi.

OpenClaw mang lại cảm giác như một sản phẩm hoàn thiện. Còn Hermes thì lại giống như một xưởng sản xuất.

Cả hai tác nhân đều có thể hoạt động với quyền truy cập hệ thống đáng kể, vì vậy lựa chọn triển khai rất quan trọng. Hermes chạy với các đặc quyền của tài khoản khởi chạy nó, và tài liệu bảo mật của chính nó nêu rõ không được chạy cổng với quyền root. OpenClaw có mô hình hộp cát phát triển hơn trên lý thuyết, nhưng kho lưu trữ của chính nó cũng cho thấy công việc tăng cường bảo mật đang được tiến hành xung quanh quyền truy cập kỹ năng, thư mục kỹ năng có thể ghi và các thiết lập mặc định của hộp cát.

Trên thực tế, không nên coi cả hai là "an toàn mặc định" trong môi trường sản xuất nếu không có sự cách ly cẩn thận, cấu hình quyền tối thiểu và xem xét bất kỳ sự tích hợp hoặc kỹ năng nào của bên thứ ba.

Bạn phải hết sức cẩn thận khi làm việc với các tác nhân. Kỹ năng có thể bị nhiễm, mô hình có thể bị ảo giác, và mọi thứ có thể đi sai hướng. Nếu bạn không thiết lập các biện pháp bảo vệ thích hợp, mọi chuyện có thể trở nên rất, rất tồi tệ.

Ví dụ, trong một trong những quy trình "tóm tắt buổi sáng" của chúng tôi, mô hình đã tưởng tượng ra tên, thứ tự và bắt đầu soạn thảo email cho những người có ảnh hưởng trong cộng đồng AI và thiết lập các giao dịch trên Polymarkets. Quy trình này chỉ đơn giản là nghiên cứu tin tức và gửi một tin nhắn Telegram với các lựa chọn của nó.

Điều này có thể (và có lẽ cuối cùng sẽ) xảy ra với Hermes, OpenClaw, hoặc bất kỳ công cụ trí tuệ nhân tạo nào mà bạn sử dụng.

Việc cài đặt Hermes rất đơn giản . Tuy nhiên, nó không giống như cài đặt một ứng dụng theo cách bạn thường nghĩ.

Thay vì chạy trình cài đặt, bạn phải mở cửa sổ dòng lệnh (terminal) và sao chép rồi dán lệnh này:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Lệnh duy nhất đó xử lý mọi thứ — Python, Node.js, ripgrep, ffmpeg, sao chép kho lưu trữ, môi trường ảo và lệnh hermes toàn cục. Sau khi hoàn tất, bạn đã sẵn sàng trò chuyện. Nếu bạn đang sử dụng macOS hoặc Linux (bao gồm cả WSL2 trên Windows), thì chỉ cần lệnh này là đủ. Sau khi hoàn tất, hãy tải lại shell và chạy lệnh:

nguồn ~/.bashrc

Từ đó, việc thiết lập tác nhân của bạn rất đơn giản. Nhập lệnh:

thiết lập Hermes

Khi đã làm như vậy, bạn sẽ có thể cấu hình mọi thứ cùng một lúc.

Nếu bạn muốn thử các mô hình khác nhau, việc chọn nhà cung cấp AI cũng đơn giản không kém. Chỉ cần nhập lệnh này vào terminal:

mô hình Hermes

Lệnh này sẽ hướng dẫn bạn quy trình chọn mô hình tốt nhất. Nous Portal cung cấp tính năng đăng nhập OAuth không cần cấu hình. OpenRouter cho phép bạn truy cập hàng chục mô hình chỉ với một khóa API duy nhất. Nếu bạn muốn chạy hoàn toàn trên các mô hình mã nguồn mở, bạn có thể tích hợp Qwen, DeepSeek hoặc bất kỳ điểm cuối nào tương thích với OpenAI — bao gồm cả việc chạy mô hình cục bộ trên phần cứng của riêng bạn. Hermes yêu cầu tối thiểu 64.000 token ngữ cảnh, điều mà mọi mô hình chính vào năm 2026 đều hỗ trợ.

Toàn bộ quá trình cài đặt chỉ mất chưa đến năm phút. Không cần Docker, không cần file YAML, không gặp rắc rối về phụ thuộc. Trình cài đặt rõ ràng được thiết kế bởi những người đã từng vật lộn với đủ loại kịch bản cài đặt lỗi để biết những gì không nên làm.

Để bắt đầu tương tác với Hermes, bạn chỉ cần gõ một lệnh đơn giản và thế là xong! Mọi thứ sẽ diễn ra trong cửa sổ terminal. Vì vậy, chỉ cần gõ lệnh này:

trò chuyện hermes

Đây là lúc mọi thứ trở nên thú vị. Sau khi kết nối Hermes với Telegram, về cơ bản bạn sẽ có một trợ lý AI cá nhân trong túi, có thể truy cập từ bất kỳ thiết bị nào, ở bất cứ đâu, với hỗ trợ ghi âm giọng nói và khả năng trò chuyện nhóm.

Quá trình thiết lập chỉ mất khoảng hai phút. Mở Telegram và tìm kiếm @BotFather — đó là bot chính thức của Telegram dùng để tạo Bots.

Hãy gửi lệnh này đến Botfather để nó hướng dẫn bạn qua quy trình tạo bot của riêng mình:

Sau khi bot trả lời, quá trình thiết lập rất đơn giản. Hãy đặt tên cho bot của bạn (ví dụ như "MyHermesbot" hoặc bất cứ tên nào bạn muốn đặt cho trợ lý ảo của mình), và BotFather sẽ cung cấp cho bạn một Token. Sao chép mã Token đó. Hãy nhớ rằng tất cả Bots Telegram đều cần có tên kết thúc bằng "bot".

Sau khi hoàn tất và tạo xong bot Telegram, hãy mở cửa sổ terminal của Hermes và chạy lệnh sau:

thiết lập Hermes

Quá trình này sẽ hướng dẫn bạn cấu hình. Chỉ cần dán Token của bot khi được yêu cầu, và cổng kết nối sẽ lo phần còn lại. Cổng kết nối là một quy trình duy nhất kết nối đồng thời tất cả các nền tảng nhắn tin của bạn (Telegram, Discord, Slack, WhatsApp, Signal). Bạn không cần thiết lập riêng từng nền tảng nếu chỉ muốn sử dụng Telegram.

Sau khi cổng kết nối hoạt động, hãy mở bot mới của bạn trong Telegram và gửi tin nhắn cho nó. Vậy là xong. Giờ đây bạn đã có thể nói chuyện với Hermes từ điện thoại của mình. Nó có thể gửi cho bạn kết quả tác vụ theo lịch trình, nhận bản ghi âm được tự động chuyển đổi thành văn bản, xử lý việc tải lên tập tin và thậm chí hoạt động trong các cuộc trò chuyện nhóm mà bạn có thể @nhắc đến nó.

Chỉ riêng tính năng ghi âm giọng nói thôi cũng đáng giá tiền thiết lập rồi. Bạn có thể gửi tin nhắn thoại như "tóm tắt những tin tức nổi bật nhất trên Hacker News hôm nay và gửi cho tôi ba tin hàng đầu"—và phần mềm sẽ xử lý âm thanh, thực hiện nhiệm vụ và trả lời bằng văn bản. Không cần phải gõ chữ gì cả.

Nó thậm chí còn cho phép bạn chạy lệnh "hermes claw migrate" trong trường hợp bạn muốn loại bỏ OpenClaw và chuyển mọi thứ sang Hermes. Các lệnh khác với nhiều tính năng cụ thể hơn có sẵn trên trang Github và tài liệu của dự án.

Nếu bạn là nhà phát triển hoặc chuyên gia công nghệ muốn tìm một agent có khả năng cải thiện theo thời gian, hoạt động trên cơ sở hạ tầng giá rẻ và hỗ trợ các mô hình mở, Hermes là lựa chọn tối ưu. Nó cũng sẽ là lựa chọn tốt hơn nếu bạn sử dụng một agent để thực hiện cùng một tác vụ lặp đi lặp lại.

Tuy nhiên, nếu bạn cần trải nghiệm hoàn thiện nhất với khả năng tích hợp IDE rộng rãi nhất và cộng đồng lớn nhất, OpenClaw vẫn là lựa chọn an toàn hơn.

Nếu bạn thực sự nghiêm túc về năng suất AI, câu trả lời thực sự là sử dụng cả hai. Quy trình làm việc đa tác nhân không phải là sự thỏa hiệp, mà là lợi thế cạnh tranh. Việc có một tác nhân điều phối trong khi một tác nhân khác thực thi, sử dụng các mô hình khác nhau cho các nhiệm vụ khác nhau và có bản sao lưu khi một tác nhân gặp sự cố, sẽ tạo ra kết quả mà không tác nhân nào có thể đạt được khi hoạt động riêng lẻ. Vòng lặp tự cải tiến của Hermes có nghĩa là nó sẽ ngày càng tốt hơn mỗi ngày bạn sử dụng. Hệ sinh thái của OpenClaw có nghĩa là bạn sẽ không bao giờ Short các tích hợp.

Đối với các trường hợp sử dụng cụ thể: người sáng tạo nội dung và nhà báo sẽ thấy hệ thống kỹ năng của Hermes vô cùng hữu ích — nó biến các quy trình nghiên cứu và viết bài lặp đi lặp lại thành các quy trình tự động hóa giúp cải thiện mỗi ngày.

Các nhà phát triển được hưởng lợi từ thiết lập đa tác nhân, phân chia khối lượng công việc giữa các mô hình khác nhau dựa trên các tác vụ mà mỗi mô hình xử lý tốt nhất, với chi phí thấp hơn.

Các nhà khoa học dữ liệu và kỹ sư học máy có được các công cụ tích hợp sẵn để tinh chỉnh và học tăng cường mà OpenClaw không cung cấp.

Và bất kỳ ai có ngân sách hạn chế đều có thể sử dụng Hermes với LMStudio trên máy tính cấu hình thấp của mình để chạy một tác nhân không tốn chi phí vận hành.

Khu vực:

AI Tạo Sinh

Metaverse

Layer 1

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan