클라우드플레어가 AI 에이전트 프로젝트인 '프로젝트 씽크'를 출시했습니다. 진정한 장벽은 지능이 아니라, 유휴 컨테이너 하나하나가 비용을 낭비하고 있다는 점입니다.

이 기사는 기계로 번역되었습니다

원문 표시

1억 명의 지식 근로자가 각각 상주 AI 비서를 필요로 하는 상황에서 , 기존 컨테이너 아키텍처는 지루하지만 치명적인 문제점을 안고 있습니다. 컨테이너 내에서 무엇이 실행되든 실행되지 않든 비용이 계속 발생한다는 것입니다.

10,000개의 에이전트가 각각 전체 시간의 1%만 활성화된다고 가정하면, 컨테이너 배포에는 10,000개의 인스턴스를 상시 유지해야 합니다. 이러한 리소스 낭비를 막기 위해 Cloudflare는 이번 달에 차세대 에이전트 SDK인 Project Think를 출시하고 GitHub 에서 오픈 소스로 공개했습니다.

이 회사는 자사의 에이전트 SDK가 이미 프로덕션 환경에서 "수천 개"의 에이전트를 구동하고 있다고 주장합니다. 프로젝트 씽크는 이러한 기반 위에 6가지 새로운 기본 요소를 도입하여 AI의 인지 능력이 아닌 "지속 가능성, 보안 및 비용"이라는 세 가지 인프라 문제를 해결합니다.

프로젝트 씽크란 무엇일까요? 여섯 가지 새로운 핵심 요소에 대한 분석

I. 광섬유를 통한 안정적인 실행

기존의 상태 비저장 함수는 실행 도중 오류가 발생하여 이전 진행 상황을 모두 잃어버립니다. 파이버는 `runFiber()` 함수가 실행 전에 상태를 SQLite 인스턴스에 기록하고, 에이전트가 `stash()` 함수를 통해 언제든지 현재 상태를 저장할 수 있도록 설계되었습니다. 오류가 발생하더라도 `onFiberRecovered` 함수에서 실행을 재개할 수 있습니다. 이는 장시간 실행되는 작업(예: 몇 시간 동안 실행되는 연구 에이전트)이 실제 환경에서 안정적으로 작동할 수 있도록 하는 핵심 요소입니다.

II. 하위 에이전트

자식 프록시는 부모 프록시와 동일한 위치에 있는 Durable Object로 존재하며, 각각 독립적인 SQLite 데이터베이스와 실행 환경을 가지고 있습니다. 이러한 객체는 Facets 메커니즘을 통해 부모 프록시와 동일한 위치에 유지됩니다. TypeScript는 런타임에 오류를 발생시키는 대신 컴파일 타임에 오용을 감지할 수 있습니다.

III. 지속 세션

각 메시지에는 parent_id가 있어 트리 구조를 형성합니다. 이 시스템은 fork(원래 대화 경로를 방해하지 않고 분기 탐색) 및 비파괴적 압축(오래된 메시지를 삭제하는 대신 요약)을 지원하며, FTS5 전문 검색 기능이 내장되어 있습니다. 이를 통해 "AI 비서가 여러 번의 대화 후 기억력을 잃는" 문제를 해결할 수 있습니다.

IV. 샌드박스 환경에서의 코드 실행

V8 격리 기반 동적 워커를 사용하면 시작 시간이 밀리초 단위로 측정되어 기존 컨테이너보다 100배 빠르고 메모리 효율성도 100배 높습니다. 기능 모델은 명시적 라이선스를 사용하며 기본값은 globalOutbound: null입니다. 즉, 개발자는 개방형 액세스가 아닌 각 리소스에 대한 액세스 권한을 명시적으로 부여해야 합니다.

V. 사형 집행 단계

다섯 가지 계층은 작업 강도에 따라 가벼운 계층부터 무거운 계층 순으로 배열됩니다. 0단계는 SQLite + R2 가상 파일 시스템(순수 데이터 저장 및 검색), 1단계는 샌드박스 환경에서의 JavaScript 실행, 2단계는 npm 파싱 및 esbuild 패키징 기능 추가, 3단계는 헤드리스 브라우저(브라우저 실행), 4단계는 완전한 Cloudflare 샌드박스 환경(git clone, npm test, cargo build 지원)입니다. 에이전트는 가장 무거운 계층으로 바로 진입하는 것이 아니라 작업의 복잡성에 따라 적절한 계층을 선택합니다.

VI. 직접 제작한 확장 기능

에이전트는 런타임에 자체 TypeScript 확장 도구를 작성할 수 있으며, ExtensionManager는 이러한 도구를 Dynamic Worker에 패키징합니다. 새 도구가 생성되면 영구적으로 존재하며, 미세 조정이나 RLHF가 필요하지 않습니다. 도구 관련 정보는 모델이 아닌 인프라에 저장됩니다.

기본 클래스 생각하기: 통합된 라이프사이클

Project Think는 채팅 에이전트의 전체 수명 주기(루프, 데이터 영속성, 스트리밍, 도구 실행 및 중단 후 복구)를 캡슐화하는 Think 기본 클래스를 제공합니다. 하위 클래스 상속에는 최소 5줄의 코드만 필요합니다.

내장 기능에는 컨텍스트 블록 메모리, 트리 구조 세션, FTS5 전체 텍스트 검색 및 비파괴 압축이 포함됩니다.

설계 의도는 명확합니다. 각 개발자가 바퀴를 재발명하는 데 드는 비용을 없애고 인프라가 상태 관리의 복잡성을 처리하도록 하는 것입니다.

클라우드플레어의 3단계 파동 이론

Cloudflare는 문서에서 AI 에이전트의 관점 세 단계로 제시했습니다. 첫 번째 단계는 상태를 저장하지 않는 챗봇, 두 번째 단계는 도구를 제공하지만 로컬 노트북에 국한된 코드 에이전트(Claude Code, Codex 등), 세 번째 단계는 "인프라로서의 에이전트"로, 지속적이고 서버리스이며 유휴 비용이 전혀 들지 않고 구조적으로 안전한 격리 기능을 제공합니다.

프로젝트 씽크는 세 번째 인프라 투자 물결입니다. 클라우드플레어는 클로드 코드와 같은 도구를 노트북에서 클라우드로 옮겨 장애 발생 후 복구를 가능하게 하고, 10만 개의 에이전트 비용을 최대 병렬 처리 수에 따라 책정하는 것을 주장합니다.

클라우드플레어의 AI 게이트웨이와 워커스 AI 또한 이러한 생태계의 일부라는 점을 주목할 필요가 있습니다. 프로젝트 씽크의 성공은 클라우드플레어 플랫폼의 트래픽과 수익 증가로 이어집니다. 이러한 3단계 전략은 본질적으로 시장 포지셔닝 매뉴얼이라고 할 수 있습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트