Odaily Sentient, mã nguồn mở, đã chính thức ra mắt Arena, một hoàn cảnh thời gian thực, cấp độ sản xuất dành cho các nhà phát triển AI toàn cầu để kiểm tra khả năng chịu tải và cạnh tranh cải tiến năng lực suy luận của các tác nhân AI cấp doanh nghiệp. Các đơn vị tham gia ban đầu bao gồm Founders Fund, Pantera, Franklin Templeton (với hơn 1,5 nghìn tỷ đô la tài sản đang quản lý), alphaXiv, Fireworks, OpenHands và OpenRouter.
Arena mô phỏng các tình huống thực tế trong quy trình làm việc của doanh nghiệp, bao gồm thông tin không đầy đủ, ngữ cảnh dài dòng, hướng dẫn mơ hồ và nguồn thông tin mâu thuẫn, đồng thời ghi lại toàn bộ quá trình suy luận để giúp đội ngũ kỹ thuật xác định nguyên nhân gây ra lỗi. Thử thách đầu tiên tập trung vào suy luận tài liệu, yêu cầu tác nhân AI thực hiện suy luận và tính toán trên dữ liệu phi cấu trúc phức tạp.
Julian Love, đối tác quản lý của Franklin Templeton Digital Assets, cho biết hoàn cảnh có cấu trúc như Arena sẽ giúp ngành công nghiệp phân biệt giữa "những ý tưởng tiềm năng" và "những khả năng thực sự có thể được sử dụng trong môi trường sản xuất". Himanshu Tyagi, đồng sáng lập của Sentient, lưu ý rằng các công ty cần xác thực tính ổn định và khả năng lặp lại của suy luận tác nhân trong hoàn cảnh sản xuất. Arena sẽ ra mắt trên toàn cầu, với kế hoạch tổ chức các sự kiện trực tiếp tại San Francisco bắt đầu từ tháng 3 năm 2026.


