本文为机器翻译
展示原文

【Sentient 新基础设施 ROMA 评测】 大家好,我是 Nyangburger。 Sentient 最近举办了一场精彩的活动,所以我决定第一时间参与。 我将撰写一篇关于 Sentient 新基础设施项目 ROMA(递归开放元代理)的深度评测。 我将深入探讨细节,并在构建虚拟测试环境的过程中分享我的想法。 简而言之,ROMA 不仅仅是一个简单的代理;它有潜力成为解决 AI 推理“信任”问题的关键基础设施。 让我们分析一下 ROMA 在此时此刻为何如此重要,以及它与现有模型有何不同。 黑盒 AI 的终结与“递归推理”的开端 常用的 LLM 和代理最大的问题是什么?它们在“长周期任务”中表现不佳。虽然它擅长总结以太坊白皮书,但如果你让它“分析过去三年排名前十的 DeFi 协议的表现,并将其与宏观经济指标进行比较”,它就会迷失方向,甚至出现幻觉。这是因为在人工智能的运行过程中,错误会逐步累积。 然而,由 Sentient 开发的 ROMA 凭借其“递归结构”和“透明性”正面解决了这个问题。 {1. ROMA 的核心架构:像 CEO 一样工作的 AI} 为了便于理解 ROMA,可以想象一个“高效的组织架构图”。 传统的智能体就像一个独自敲鼓的自由职业者,而 ROMA 则是一个“元智能体”,它会不断地将任务分解成子任务并进行分配。 ROMA 通过以下四阶段无限循环来解决复杂问题: 第一阶段:原子化器:评估传入的任务。您可以独立判断一项任务是否能够独立完成,或者是否需要将其分解成更小的部分。 步骤 2:规划器:如果需要分解,它会将任务分解成子任务,就像项目经理将任务分解成开发、设计和规划阶段一样。 步骤 3:执行器:利用搜索工具、数据分析工具或其他专用 AI 模型执行分解后的任务。 步骤 4:聚合器:收集并验证每次执行的结果,并将它们汇总成最终报告。 ROMA 的递归特性就体现在这个过程中。如果子任务很复杂,则会重复这四个步骤,深入挖掘树状结构。 {2. 超强性能:数据说话} 在 Web3 领域,规则是“不要轻信,要验证”。ROMA 的性能已通过基准测试数据得到验证。Seal-0 基准测试结果令人震惊,该测试旨在检验其复杂的搜索和推理能力。 ROMA 搜索:45.6%(遥遥领先,位居榜首) Kimi Researcher:36% Gemini 2.5 Pro:19.8% Open Deep Search:8.9% ROMA 的准确率是 Google Gemini 的两倍以上。这有力地证明了 ROMA 并非简单地抓取信息,而是在保持上下文的情况下进行逻辑推理。 {3. 为什么 Web3 和开发者需要 ROMA?(实用性和清晰度)} 我被这个框架吸引,不仅是因为它的性能,还因为 ROMA 的理念基于开源和透明。 打破黑箱(阶段追踪): 现有的商业代理程序只是提供结果,却无法解释结果背后的原因。然而,ROMA 提供了“阶段追踪”功能。从输入到输出的整个推理过程,都通过 Pydantic 架构透明地呈现。调试是可能的,并且可以通过人为干预(人机交互)来识别错误。 这在信任至关重要的领域(例如链上数据分析和财务报告)尤为重要。 模块化: ROMA 就像乐高积木。您可以自由地将所需的 LLM(GPT-4、Claude、Llama 等)或工具插入到每个节点(阶段)中。 利用模块化的一个策略示例是成本效益策略:将规划阶段外包给智能的 GPT-4 模型,将简单的搜索外包给轻量级的 Llama 模型。 并行性: 独立的子任务并行运行。这极大地加速了需要处理海量数据的研究任务。 {4. 结语:Sentient 的宏伟愿景 Sentient 相信,ROMA 开启了一个“任何人都可以使用最佳技术构建自己的代理”的世界。 这不仅仅是一个工具;它更像是一个完整的协议。 尽管当前的人工智能领域以封闭模型为主导,但 ROMA 提供了一个坚实的基础,开源社区可以在此基础上构建针对金融、法律和创意写作等领域的专业“专家代理”。 基于此,我相信 Sentient 将进一步巩固其在人工智能领域的地位。

Wecryptotogether
@Edward__Park
02-07
🗃️ 실제 사용되는 Sentient의 인프라 ROMA와 V2 업그레이드 1️⃣ ROMA 센티언트의 프로덕트 중 하나로 단순한 AI 에이전트가 아닌 누구나 함께 개발이 가능한 오픈소스 메타 에이전트 프레임워크로 복잡한 작업을 재귀적 계층 구조로 분해하여 멀티 에이전트 시스템을 구축하는데 특화된 인프라입니다. x.com/SentientAGI/st…
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论