Tác giả đã chia sẻ một hệ thống điều phối tác nhân dựa trên OpenClaw, tạo thành một "đội ngũ phát triển đa tác nhân" bao gồm các mô hình như Codex, Claude Code và Gemini , và được lên lịch đồng bộ bởi trình điều phối cục bộ Zoe để đạt được một vòng lặp khép kín hoàn toàn tự động từ yêu cầu đến yêu cầu kéo (PR).
Tác giả bài viết: @elvissun
Nguồn bài viết: Nền tảng X
Tôi không còn sử dụng trực tiếp Codex hoặc Claude Code nữa.
Tôi sử dụng OpenClaw làm lớp điều phối. Trình điều phối của tôi, Zoe, chịu trách nhiệm tạo ra các tác nhân con, viết lời nhắc cho chúng, chọn mô hình phù hợp nhất cho nhiệm vụ khác nhau, theo dõi tiến độ và thông báo cho tôi qua Telegram khi yêu cầu kéo (PR) có thể được hợp nhất.
Dữ liệu từ 4 tuần qua:
- Lần commit trong một ngày. Đó là ngày làm việc hiệu quả nhất của tôi — tôi có ba cuộc gọi với khách hàng hôm đó và thậm chí không cần mở trình soạn thảo. Trung bình, tôi commit khoảng 50 lần một ngày.
- Bảy pull request trong vòng 30 phút. Hoàn cảnh từ ý tưởng đến sản phẩm diễn ra nhanh như chớp, vì việc lập trình và kiểm tra phần lớn được tự động hóa.
- Cam kết → Doanh thu định kỳ hàng tháng (MRR): Tôi đã sử dụng hệ thống này cho việc phát triển sản phẩm SaaS B2B thực tế, làm việc với người sáng lập để dẫn dắt bán hàng, cho phép đáp ứng hầu hết các yêu cầu chức năng trong cùng một ngày. Tốc độ trực tiếp chuyển thành khách hàng trả tiền.

sự tương phản:
Một tháng trước: Chỉ sử dụng Claude Code/Codex
Một tháng sau: OpenClaw điều phối dự án Claude Code/Codex.
Lịch sử Git của tôi giờ trông như thể tôi vừa mới tuyển dụng một đội ngũ phát triển vậy.
Trên thực tế, tôi chỉ đơn giản nâng cấp vai trò của mình từ "quản lý Claude Code" lên "quản lý một Đặc vụ OpenClaw, mà đặc vụ này lại quản lý toàn bộ một đội ngũ Đặc vụ Claude Code và Codex."
Tỷ lệ thành công:
Hầu hết nhiệm vụ nhỏ và vừa đều có thể hoàn thành trong một lần mà không cần sự can thiệp của con người.
trị giá:
Claude có giá khoảng 100 đô la mỗi tháng, Codex có giá khoảng 90 đô la mỗi tháng, và người mới bắt đầu có thể trả 20 đô la.
Tại sao cách này lại hiệu quả hơn so với việc sử dụng trực tiếp Codex hoặc Claude Code?
Codex và Claude Code hầu như không biết gì về việc kinh doanh của bạn.
Họ chỉ nhìn vào mã lập trình, chứ không hiểu được logic việc kinh doanh tổng thể.
OpenClaw đã thay đổi logic này.
Nó là lớp điều phối giữa bạn và tất cả các nhân viên của bạn—nó lưu trữ toàn bộ bối cảnh việc kinh doanh(dữ liệu khách hàng, Biên bản họp, các quyết định lịch sử , thành công và thất bại) trong Obsidian Vault của tôi và chuyển đổi bối cảnh lịch sử này thành các lời nhắc chính xác cho từng nhân viên được lập trình.

Coding Agent tập trung vào mã lập trình.
Người điều phối chịu trách nhiệm về chiến lược.
Kiến trúc cấp cao
Tuần trước, Stripe đã phát hành hệ thống tác nhân phụ trợ của họ, "Minions" - một tác nhân lập trình song song kết hợp với lớp điều phối trung tâm.
Tôi vô tình tạo ra một hệ thống tương tự, nhưng nó chạy cục bộ trên máy Mac mini của tôi.
Tại sao cần có một trình điều phối Agent?
Cửa sổ ngữ cảnh là trò chơi tổng bằng không.
Bạn phải chọn những gì cần điền vào:
Nếu nhồi nhét toàn mã lập trình vào, sẽ không còn chỗ cho bối cảnh việc kinh doanh . Nếu nhồi nhét toàn thông tin lịch sử khách hàng, sẽ không còn chỗ cho mã nguồn nữa. Đó là lý do tại sao hệ thống hai tầng hoạt động hiệu quả: mỗi AI chỉ được nạp nội dung cụ thể mà nó cần.

Quy trình làm việc hoàn chỉnh gồm 8 bước
Dưới đây là một nghiên cứu trường hợp thực tế về quy trình.
Bước 1: Nhu cầu của khách hàng → Cùng Zoe tháo lắp
Khách hàng muốn đội ngũ phát triển tái sử dụng các cấu hình hiện có.
Sau cuộc họp, Zoe và tôi đã thảo luận về các yêu cầu.
Vì biên bản cuộc họp được tự động đồng bộ hóa với Obsidian Vault, nên tôi không cần phải giải bối cảnh. Chúng tôi đã cùng nhau tìm hiểu tính năng này và tìm ra một hệ thống mẫu cho phép họ lưu và chỉnh sửa các cấu hình hiện có.
Zoe làm ba việc:
- Nạp tiền vào hạn mức tín dụng của khách hàng thông qua API quản trị.
- Đọc cấu hình khách hàng từ cơ sở dữ liệu sản xuất (quyền chỉ đọc; Codex Agent sẽ không bao giờ có quyền này).
- Khởi chạy Codex Agent với lời nhắc ngữ cảnh đầy đủ.
Bước 2: Khởi động Agent
Mỗi Agent có cây thư mục làm việc và phiên tmux riêng biệt.


Ưu điểm của việc sử dụng tmux là bạn có thể can thiệp giữa chừng mà không cần phải tắt tiến trình.



Trạng thái nhiệm vụ được ghi lại trong một registry JSON.
Bước 3: Vòng lặp giám sát tự động
Thực thi mỗi 10 phút thông qua cron:

- Kiểm tra xem phiên tmux có tồn tại hay không.
- Kiểm tra trạng thái yêu cầu mua hàng (PR)
- Kiểm tra CI
- Tối đa lần lần thử lại tự động
- Chỉ thông báo cho tôi khi cần sự can thiệp của con người.
Bước 4: Nhân viên tạo yêu cầu mua hàng (PR)
Việc tạo ra một yêu cầu kéo (PR) không phải là kết thúc.
Các tiêu chí hoàn thành đầy đủ bao gồm:
- Tạo PR
- Không có xung đột
- CI đã vượt qua
- Đã được Codex phê duyệt
- Claude đã chấp thuận.
- Gemini đã phê duyệt
- Nếu có liên quan đến các yếu tố giao diện người dùng, ảnh chụp màn hình phải được đính kèm.
Bước 5: Đánh giá mã ba mô hình
Mỗi yêu cầu mua hàng (PR) được xem xét bởi ba mô hình trí tuệ nhân tạo. Chúng có thể thu thập các thông tin khác nhau.
- Codex: Mạnh nhất về logic và khả năng xử lý ranh giới.
- Gemini: Bảo mật và mở rộng tuyệt vời
- Claude: Thận trọng, thường bỏ qua những lời khuyên không quan trọng.
Bước 6: Kiểm thử tự động
Hệ thống CI của chúng tôi chạy lượng lớn các bài kiểm tra tự động:
Kiểm tra Lint và TypeScript - kiểm thử đơn vị - kiểm thử E2E - kiểm thử Playwright cho hoàn cảnh xem trước (giống như môi trường sản xuất)
Tuần trước tôi đã thêm một quy tắc mới: nếu yêu cầu kéo (PR) thực hiện bất kỳ thay đổi nào đối với giao diện người dùng, nó phải bao gồm ảnh chụp màn hình trong phần mô tả PR. Nếu không, CI sẽ thất bại. Điều này giúp giảm đáng kể thời gian xem xét và tôi có thể xem các thay đổi một cách chính xác mà không cần phải nhấn xem trước.
Bước 7: Xem xét thủ công
Sau khi cả ba mô hình đều vượt qua kiểm tra CI, Telegram sẽ thông báo cho tôi.
Bài đánh giá của tôi chỉ mất 5-10 phút.
Với nhiều pull request, tôi thậm chí không đọc mã nguồn; tôi chỉ xem ảnh chụp màn hình.
Bước 8: Hợp nhất
Cron dọn dẹp cây công việc riêng biệt và sổ đăng ký nhiệm vụ hàng ngày.
Ralph Loop V2
Về cơ bản, đây là phiên bản nâng cấp của đường vòng Ralph Loop.
Các vòng lặp Ralph truyền thống rút ngữ cảnh từ bộ nhớ, tạo ra đầu ra, đánh giá kết quả và lưu lại các kết quả đã học. Tuy nhiên, hầu hết các triển khai đều sử dụng cùng một lời nhắc trong mỗi vòng lặp. Mặc dù kinh nghiệm được trích xuất giúp cải thiện hiệu suất truy xuất trong tương lai, nhưng bản thân lời nhắc lại tĩnh và không thể thay đổi.
Hệ thống của chúng tôi khác nhau.
Khi một Agent gặp lỗi, Zoe không chỉ đơn giản khởi động lại nó với cùng một lời nhắc. Cô ấy phân tích việc kinh doanh lỗi để xác định nguyên nhân và cách khắc phục.
Thiếu ngữ cảnh tác nhân?
"Chỉ tập trung vào ba tài liệu này."
Liệu người đại lý có đi nhầm hướng không?
"Dừng lại. Khách hàng muốn X, chứ không phải Y. Đó là điều họ nói trong cuộc họp."
Người đại diện có cần làm rõ thêm điều gì không?
"Đây là email từ một khách hàng, kèm theo lời giới thiệu về việc kinh doanh của công ty họ."
Zoe sẽ đồng hành cùng bạn trong từng bước cho đến khi nhiệm vụ hoàn thành. Cô ấy sở hữu những thông tin mà nhân viên hỗ trợ không có – lịch sử khách hàng, Biên bản họp, những lần thử trước và lý do thất bại. Cô ấy sử dụng thông tin này để viết ra những lời nhắc chính xác hơn cho mỗi lần thử lại.
Nhưng cô ấy sẽ không đợi tôi giao nhiệm vụ.
Cô ấy chủ động tìm kiếm việc làm:
Sáng: Quét Sentry → Phát hiện 4 lỗi mới → Khởi động 4 tác nhân để điều tra và khắc phục.
Sau cuộc họp: Xem lại Biên bản họp → Đánh dấu 3 tính năng mới được khách hàng đề cập → Khởi chạy 3 Codex Agent
Buổi tối: Quét nhật ký Git → Khởi động Claude Code để cập nhật nhật ký thay đổi và tài liệu khách hàng.
Tôi đi dạo sau khi nhận được cuộc gọi từ khách hàng. Khi trở về, tôi mở Telegram:
"Đã có 7 yêu cầu kéo (PR) sẵn sàng để xem xét. 3 tính năng mới và 4 bản sửa lỗi."
Khi tác nhân thành công, mô hình thành công sẽ được ghi lại:
"Cấu trúc Prompt này phù hợp cho các chức năng lập hóa đơn."
"Bộ quy tắc yêu cầu phải cung cấp định nghĩa kiểu dữ liệu trước."
"Cần phải bao gồm đường dẫn đến tệp kiểm tra."
Các tín hiệu khen thưởng bao gồm:
- CI đã vượt qua
- Cả ba bài đánh giá AI đều đạt.
- Sáp nhập nhân tạo
Bất kỳ lỗi nào cũng sẽ kích hoạt một vòng lặp.
Theo thời gian, Zoe sẽ viết ra những lời nhắc nhở ngày càng hay hơn vì cô ấy nhớ "những gì đã được ra mắt".
Chọn đúng Đặc vụ
Không phải tất cả các tác nhân được mã hóa đều giống nhau.
Tóm tắt tham khảo:
Codex là công cụ chính của tôi.
Nó xử lý logic phía máy chủ, các lỗi phức tạp, tái cấu trúc nhiều tệp và nhiệm vụ yêu cầu suy luận trên nhiều mã nguồn. Nó chậm hơn, nhưng rất toàn diện. Tôi sử dụng nó cho 90% nhiệm vụ.
Claude Code nhanh hơn và tốt hơn trong phát triển giao diện người dùng. Nó ít gặp vấn đề về quyền truy cập hơn, lý tưởng cho các thao tác Git. (Tôi từng sử dụng nó nhiều hơn cho công việc phát triển hàng ngày, nhưng Codex 5.3 hiện nay thậm chí còn mạnh mẽ và nhanh hơn.)
Gemini có một lợi thế rõ rệt – đó là thiết kế của nó.
Khi tạo giao diện người dùng đẹp mắt, trước tiên tôi sử dụng Gemini để tạo ra các thông số kỹ thuật HTML/CSS, sau đó chuyển chúng cho Claude Code để triển khai trong hệ thống thành phần. Gemini chịu trách nhiệm về thiết kế, và Claude chịu trách nhiệm về xây dựng.
Zoe chọn tác nhân phù hợp cho mỗi nhiệm vụ và điều phối kết quả giữa chúng:
- Lỗi hệ thống thanh toán → Codex
- Sửa lỗi kiểu nút → Mã Claude
- Thiết kế bảng điều khiển mới → First Gemini
Làm thế nào để xây dựng hệ thống này?
Sao chép toàn bộ bài viết vào OpenClaw rồi hướng dẫn nó như sau:
"Hãy triển khai kiến trúc Agent Swarm này cho mã nguồn của tôi."
Nó đọc mô tả kiến trúc, tạo các tập lệnh, thiết lập cấu trúc mục lục và cấu hình giám sát cron.
Hoàn thành trong 10 phút.
Hiện không có khóa học nào được bán cho bạn.
Nút thắt cổ chai bất ngờ
Trần nhà mà tôi đang đối diện chính là ký ức.
Mỗi Đặc vụ cần có cây công việc riêng.
Mỗi worktree yêu cầu thư mục node_modules riêng.
Mỗi tác nhân phải thực hiện các bản dựng, kiểm tra kiểu dữ liệu và kiểm thử.
Việc vận hành năm tác nhân cùng lúc có nghĩa là:
- Năm trình biên dịch TypeScript song song
- Năm người chạy thử nghiệm
- Năm phần phụ thuộc được tải vào bộ nhớ.
Chiếc Mac Mini 16GB của tôi chỉ có thể chạy tối đa 4-5 agent; nếu nhiều hơn thì sẽ bắt đầu bị lỗi trao đổi bộ nhớ. Và tôi phải cầu nguyện là chúng không biên dịch cùng lúc.
Do đó, tôi đã mua một chiếc Mac Studio M4 Max với RAM 128GB (3.500 đô la) để chạy hệ thống này. Nó đã đến vào cuối tháng 3, và tôi sẽ chia sẻ xem liệu nó có đáng giá hay không.
Bước tiếp theo: Một công ty triệu đô chỉ với một người
Năm 2026, chúng ta sẽ chứng kiến lượng lớn các "công ty triệu đô chỉ với một người".
Đối với những ai hiểu cách xây dựng các tác nhân tự cải tiến một cách đệ quy, đòn bẩy thu được là vô cùng lớn.
Nó trông như thế này:
Một trợ lý ảo AI đóng vai trò như một phần mở rộng của bạn (giống như Zoe đối với tôi).
Phân công nhiệm vụ cho các chuyên viên chuyên trách:
- dự án
- Hỗ trợ khách hàng
- Vận hành và bảo trì
- chợ
Mỗi chuyên viên tập trung vào lĩnh vực chuyên môn của mình.
Bạn duy trì mức độ tập trung cao độ và khả năng kiểm soát hoàn toàn.
Thế hệ doanh nhân tiếp theo sẽ không còn thuê đội ngũ 10 người để làm những việc mà một người với hệ thống phù hợp có thể làm được.
Họ sẽ xây dựng công ty của mình như sau: tinh gọn, cải tiến nhanh chóng và phát hành sản phẩm hàng ngày.
Hiện nay, nó đang tràn lượng lớn những nội dung rác do AI tạo ra.
Đã có rất nhiều lời bàn tán xung quanh Agents và "Nhiệm vụ Consoles", nhưng vẫn chưa có kết quả thực tế, hữu hình nào.
Đây là một màn trình diễn hào nhoáng, nhưng nó không có giá trị thực tiễn nào.
Tôi muốn làm điều ngược lại:
Ít quảng cáo thổi phồng, tập trung nhiều hơn vào việc ghi lại quy trình phát triển việc kinh doanh thực tế.
Khách hàng thực sự.
Thu nhập thực tế.
Đây là bản commit thực tế ra mắt.
Điều này cũng bao gồm cả những tổn thất thực tế.
Tôi đang làm gì vậy?
Quan hệ công chúng của đại lý ——
Một công ty một người so với một công ty PR lớn.
Hãy sử dụng dịch vụ của một đại diện để giúp các công ty khởi nghiệp thu hút sự chú ý của truyền thông mà không phải trả phí dịch vụ hàng tháng lên đến 10.000 đô la.
Nếu bạn muốn xem tôi có thể tiến xa đến đâu, hãy chờ xem.




