Bài viết này được dịch máy
Xem bản gốc
Walden, người phụ trách Devin's developer Cognition, cũng đã xuất bản một bài viết về multi-agent, cảnh báo mọi người không nên xây dựng multi-agent và chỉ ra một số phương pháp phổ biến nhưng không hiệu quả, đặc biệt là những nhược điểm của kiến trúc multi-agent. Vì vậy, tôi đã so sánh cách hai công ty này đối diện và giải quyết vấn đề multi-agent.

歸藏(guizang.ai)
@op7418
06-14
Anthropic 这篇文章值得看看
详细阐述了构建多个智能体来更高效地探索复杂课题所面临的工程挑战,包括代理协调、评估和可靠性。
让 Notebooklm 总结了一下主要内容 x.com/AnthropicAI/st…


Bài viết ở đây:

Walden
@walden_yan
06-13
I see a lot of people make the same mistakes building agents. So we shared a few of the principles we use
https://cognition.ai/blog/dont-build-multi-agents…
Về việc chia sẻ ngữ cảnh và quyết định xung đột
Quan điểm của Cognition:
Các tiểu trí tuệ ngay cả khi chia sẻ ngữ cảnh nhiệm vụ ban đầu, vẫn có thể dẫn đến công việc không nhất quán do không thể nhìn thấy những gì các tiểu trí tuệ khác đang làm, vì các hành động của chúng dựa trên các giả định xung đột chưa được thiết lập. Họ nhấn mạnh nguyên tắc 1 là "chia sẻ toàn bộ ngữ cảnh và theo dõi toàn bộ trí tuệ, không chỉ là các tin nhắn riêng lẻ", nguyên tắc 2 là "các hành động mang theo quyết định ngầm, các quyết định xung đột sẽ dẫn đến kết quả tồi tệ".
Anthropic trước tiên cũng thừa nhận những hạn chế này:
"Một số lĩnh vực yêu cầu tất cả các trí tuệ chia sẻ cùng một ngữ cảnh, hoặc liên quan đến nhiều mối phụ thuộc giữa các trí tuệ, hiện không phù hợp với hệ thống đa trí tuệ". Họ đặc biệt đề cập rằng "hầu hết các nhiệm vụ mã hóa liên quan đến các nhiệm vụ có thể song song hóa thực sự ít hơn các nhiệm vụ nghiên cứu, và các trí tuệ LLM hiện tại vẫn chưa giỏi trong việc điều phối và ủy quyền cho các trí tuệ khác một cách thời gian thực". Điều này tạo nên sự hưởng ứng với việc các tiểu trí tuệ Claude Code không song song viết mã và vấn đề các mô hình nhỏ hiểu sai hướng dẫn trong "mô hình ứng dụng chỉnh sửa".
Sau đó, chúng ta hãy xem Anthropic đã vượt qua những hạn chế này như thế nào:
Mẫu điều phối: Hệ thống của Anthropic áp dụng mẫu "điều phối viên-người làm việc", với một trí tuệ chính điều phối toàn bộ quá trình và ủy quyền nhiệm vụ cho các tiểu trí tuệ chuyên môn song song. Trí tuệ chính phân tích truy vấn, xây dựng chiến lược và tạo ra các tiểu trí tuệ để khám phá đồng thời các khía cạnh khác nhau. Các tiểu trí tuệ sẽ trả lại kết quả cho trí tuệ chính để tổng hợp.
Ủy quyền rõ ràng: Họ nhấn mạnh "hướng dẫn điều phối viên cách ủy quyền", nghĩa là trí tuệ chính cần cung cấp mô tả nhiệm vụ chi tiết cho các tiểu trí tuệ, bao gồm mục tiêu, định dạng đầu ra, các công cụ và hướng dẫn nguồn, cũng như ranh giới nhiệm vụ rõ ràng để tránh trùng lặp công việc, bỏ sót hoặc hiểu sai nhiệm vụ. Ví dụ, nếu không có mô tả chi tiết, các tiểu trí tuệ có thể thực hiện lại cùng một tìm kiếm, hoặc hiểu nhiệm vụ theo các cách khác nhau.
Quản lý ngữ cảnh: Đối với các nhiệm vụ chạy dài và vấn đề tràn cửa sổ ngữ cảnh, giải pháp của Anthropic là trí tuệ chính sẽ lưu kế hoạch vào "bộ nhớ" để duy trì ngữ cảnh, ngăn chặn việc bị cắt bỏ khi cửa sổ ngữ cảnh quá lớn. Họ còn thực hiện việc các trí tuệ tóm tắt thông tin quan trọng và lưu trữ vào bộ nhớ ngoài sau kiai đoạn hoàn thành công việc, và tạo ra các tiểu trí tuệ mới khi ngữ cảnh tiếp cận giới hạn, duy trì tính liên tục thông qua việc bàn giao cẩn thận.
Giảm thiểu "trò chơi điện thoại": Họ giảm thiểu "trò chơi điện thoại" bằng cách để các tiểu trí tuệ lưu trực tiếp đầu ra vào hệ thống tệp, thay vì truyền tất cả thông tin qua điều phối viên chính. Điều này giúp nâng cao độ trung thực và hiệu suất, đồng thời giảm chi phí token cần thiết để sao chép khối lượng lớn đầu ra thông qua lịch sử đoạn hội thoại, từ đó tránh mất thông tin.
Trên tác nhân tuyến tính luồng đơn và song song đa tác nhân
Quan điểm quan điểm:
Phương pháp nguyên tắc đơn giản nhất là sử dụng "tác nhân tuyến tính luồng đơn"trong đó ngữ cảnh là liên tục. Họ cho rằng các tác nhân hiện tại không đáng tin cậy bằng con người trong giao tiếp chủ động, ngữ cảnh dài và do đó sự hợp tác của nhiều tác nhân sẽ chỉ dẫn đến các hệ thống dễ vỡ.
Quan điểm nhân học:
Anthropic áp dụng tính năng song song đa tác nhân, cho rằng đó là “cách chính để mở rộng hiệu suất”.
Họ cho rằng đối với các vấn đề mở, không thể đoán trước như nghiên cứu, hệ thống đa tác nhân đặc biệt phù hợp vì chúng cung cấp tính linh hoạt để điều chỉnh phương pháp dựa trên phát hiện và cho phép các tác nhân phụ hoạt động song song, do đó đạt được "nén" và "tách biệt các mối quan tâm". Thông qua đánh giá nội bộ, họ thấy rằng hệ thống nghiên cứu đa tác nhân hoạt động tốt hơn 90,2% so với hệ thống tác nhân đơn lẻ trong các truy vấn theo chiều rộng.
Tăng tốc: Anthropic đã cải thiện đáng kể thời gian nghiên cứu bằng cách giới thiệu hai loại song song hóa: tác nhân chính khởi chạy 3-5 tác nhân phụ song song và các tác nhân phụ sử dụng hơn 3 công cụ song song, do đó giảm thời gian nghiên cứu các truy vấn phức tạp tới 90%.
Tiêu thụ mã thông báo: Tuy nhiên, Anthropic cũng thừa nhận rằng đây là một "nhược điểm": "Những kiến trúc này tiêu thụ mã thông báo nhanh chóng trong thực tế" và các hệ thống đa tác nhân thường sử dụng nhiều mã thông báo hơn khoảng 15 lần so với các tương tác trò chuyện. Do đó, các hệ thống đa tác nhân chỉ phù hợp với các tình huống mà "giá trị của nhiệm vụ đủ cao để trả cho hiệu suất tăng lên".
Nút thắt cổ chai phối hợp: Tác nhân chính hiện tại của Anthropic là "thực hiện đồng bộ các tác nhân phụ", chờ từng nhóm tác nhân phụ hoàn thành trước khi tiếp tục, điều này đơn giản hóa việc phối hợp nhưng lại tạo ra nút thắt cổ chai trong luồng thông tin. Họ đề cập rằng thực hiện không đồng bộ sẽ đạt được tính song song lớn hơn, nhưng sẽ làm tăng các thách thức về phối hợp kết quả, tính nhất quán của trạng thái và lan truyền lỗi, và hy vọng rằng trong tương lai, khi mô hình có thể xử lý nhiệm vụ nghiên cứu dài hơn và phức tạp hơn, thì việc cải thiện hiệu suất sẽ chứng minh rằng tính phức tạp của nó là xứng đáng.
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan





