Odaily星球日報訊 開源 AI 實驗室 Sentient 正式推出 Arena,這是一個面向全球 AI 開發者的實時生產級環境,用於對企業級 AI 智能體的推理能力進行壓力測試與競賽式迭代。初始階段參與方包括 Founders Fund、Pantera、管理資產規模超 1.5 萬億美元的 Franklin Templeton,以及 alphaXiv、Fireworks、OpenHands、OpenRouter 等。
Arena 模擬企業工作流中的真實場景,包括信息不完整、上下文冗長、指令含糊及來源衝突等情況,並記錄完整推理軌跡以供工程團隊定位失敗原因。首項挑戰聚焦文檔推理,要求 AI 智能體對複雜非結構化數據進行推理與計算。
Franklin Templeton Digital Assets 管理合夥人 Julian Love 表示,Arena 這樣的結構化環境將幫助行業區分“有潛力的想法”與“真正能用於生產的能力”。Sentient 聯合創始人 Himanshu Tyagi 表示,企業需要在生產環境中驗證智能體推理的穩定性與可重複性。Arena 將面向全球啟動,計劃從 2026 年 3 月起在舊金山舉行線下活動。
