Mục lục lục
ToggleKhi 100 triệu người lao động tri thức cần một trợ lý AI thường trực, kiến trúc container truyền thống gặp phải một vấn đề nhàm chán nhưng chí mạng: nó đốt tiền bất kể có ứng dụng nào đang chạy trong container hay không.
Với 10.000 agent, mỗi agent chỉ hoạt động 1% thời gian, việc triển khai container sẽ yêu cầu duy trì 10.000 instance liên tục. Để tiết kiệm tài nguyên, Cloudflare đã phát hành Project Think trong tháng này, được định vị là phiên bản thế hệ tiếp theo của Agents SDK, và mã nguồn mởGitHub .
Công ty này tuyên bố rằng bộ SDK Agents của họ hiện đang vận hành "hàng nghìn" tác nhân trong hoàn cảnh sản xuất. Dự án Think xây dựng trên nền tảng này bằng cách giới thiệu sáu nguyên tắc cơ bản mới, không tập trung vào khả năng nhận thức của AI, mà là ba vấn đề về cơ sở hạ tầng: "tính bền vững, bảo mật và chi phí".
Project Think là gì? Phân tích chi tiết sáu thành phần cơ bản mới của dự án.
I. Khả năng thực thi bền vững thông qua sợi quang
Các hàm không trạng thái truyền thống thường bị lỗi giữa chừng khi thực thi, làm mất toàn bộ tiến trình trước đó. Fiber được thiết kế sao cho phương thức `runFiber()` ghi trạng thái vào một thể hiện SQLite trước khi thực thi, và tác nhân có thể lưu trữ trạng thái hiện tại bất cứ lúc nào thông qua phương thức `stash()`. Trong trường hợp xảy ra lỗi, quá trình thực thi có thể tiếp tục từ phương thức `onFiberRecovered`. Đây là điều kiện cơ bản để cho phép nhiệm vụ chạy dài (chẳng hạn như các tác nhân nghiên cứu chạy trong nhiều giờ) tồn tại trong hoàn cảnh thực tế.
II. Các đại lý phụ
Các proxy con tồn tại dưới dạng các Đối tượng Bền vững (Durable Objects) cùng vị trí, mỗi proxy có cơ sở dữ liệu SQLite và hoàn cảnh thực thi riêng biệt, duy trì sự cùng vị trí với proxy cha thông qua cơ chế Facets. TypeScript có thể phát hiện việc sử dụng sai mục đích tại thời điểm biên dịch, thay vì báo lỗi tại thời điểm chạy.
III. Các phiên họp liên tục
Mỗi tin nhắn đều có một parent_id, tạo thành cấu trúc cây. Nó hỗ trợ phân nhánh (khám phá nhánh mà không làm gián đoạn đường hội thoại ban đầu) và nén không phá hủy (tóm tắt các tin nhắn cũ thay vì xóa chúng), đồng thời tích hợp sẵn chức năng tìm kiếm toàn văn FTS5. Điều này giải quyết được vấn đề "trợ lý AI mất trí nhớ sau lần cuộc hội thoại".
IV. Thực thi mã trong môi trường biệt lập
Sử dụng Dynamic Workers (dựa trên V8 isolate), thời gian khởi động được tính bằng mili giây, nhanh hơn 100 lần và tiết kiệm bộ nhớ hơn 100 lần so với các container truyền thống. Mô hình năng lực sử dụng cấp phép rõ ràng: mặc định là globalOutbound: null, nghĩa là các nhà phát triển phải cấp quyền truy cập rõ ràng cho từng tài nguyên, thay vì mặc định là quyền truy cập mở.
V. Thang hành bậc thang
Năm cấp độ được sắp xếp từ nhẹ nhất đến nặng nhất: Cấp độ 0 là SQLite + hệ thống tệp ảo R2 (chỉ lưu trữ và truy xuất dữ liệu), Cấp độ 1 là thực thi JS trong môi trường sandbox, Cấp độ 2 bổ sung thêm phân tích cú pháp npm và đóng gói esbuild, Cấp độ 3 là trình duyệt không giao diện người dùng (Browser Run), và Cấp độ 4 là Cloudflare Sandbox hoàn chỉnh (hỗ trợ git clone, npm test và cargo build). Trình tác vụ sẽ chọn cấp độ phù hợp dựa trên độ phức tạp nhiệm vụ, thay vì mặc định chọn cấp độ nặng nhất.
VI. Các phần mở rộng do người dùng tự viết
Các tác nhân có thể tự viết các công cụ mở rộng TypeScript của riêng mình trong thời gian chạy, sau đó được ExtensionManager đóng gói vào Dynamic Worker. Khi một công cụ mới được tạo, nó sẽ tồn tại vĩnh viễn—không cần tinh chỉnh hay RLHF; kiến thức về công cụ nằm trong cơ sở hạ tầng, chứ không phải trong mô hình.
Think Base Class: Unallifecycle
Dự án Think cung cấp lớp cơ sở Think, bao hàm toàn bộ vòng đời của một tác nhân trò chuyện: vòng lặp, Persistence, truyền dữ liệu, thực thi công cụ và phục hồi sau khi bị gián đoạn. Việc kế thừa lớp con chỉ yêu cầu tối thiểu 5 dòng mã.
Các tính năng tích hợp bao gồm bộ nhớ khối ngữ cảnh, phiên làm việc dạng cây, tìm kiếm toàn văn FTS5 và nén dữ liệu không phá hủy.
Mục tiêu thiết kế rất rõ ràng: loại bỏ chi phí phải tự mình tạo ra mọi thứ từ đầu cho mỗi nhà phát triển và để cơ sở hạ tầng gánh vác sự phức tạp của việc quản lý trạng thái.
Lý thuyết ba làn sóng của Cloudflare
Trong tài liệu của mình, Cloudflare đề xuất quan điểm ba giai đoạn của các tác nhân AI: giai đoạn đầu tiên là chatbot không trạng thái, giai đoạn thứ hai là các tác nhân mã nguồn có công cụ nhưng bị giới hạn trên máy tính xách tay cục bộ (Claude Code, Codex, v.v.), và giai đoạn thứ ba là "tác nhân như cơ sở hạ tầng": hoạt động liên tục, không cần máy chủ, chi phí chờ bằng không và được cách ly an toàn về mặt cấu trúc.
Dự án Think là làn sóng đầu tư cơ sở hạ tầng thứ ba. Lập luận của Cloudflare là: chuyển các công cụ như Claude Code từ máy tính xách tay lên đám mây, cho phép chúng phục hồi sau sự cố và làm cho chi phí của 100.000 agent bằng với mức sử dụng thực tế chứ không phải số lượng song song tối đa.
Điều đáng chú ý là AI Gateway và Workers AI của chính Cloudflare cũng là một phần của hệ sinh thái này. Sự thành công của Project Think cũng chuyển hóa thành lưu lượng truy cập và thu nhập cho nền tảng Cloudflare. Câu chuyện ba giai đoạn này về cơ bản là một sách hướng dẫn định vị thị trường.




