Pantera và Franklin Templeton tham gia Sentient Arena để thử nghiệm hiệu năng của các tác nhân AI cấp doanh nghiệp.

avatar
PANews
02-27
Bài viết này được dịch máy
Xem bản gốc

Ngày 27 tháng 2, PANews đưa tin, dẫn nguồn từ Cointelegraph, mã nguồn mở Sentient đã công bố ra mắt Arena, một hoàn cảnh thử nghiệm cấp độ sản xuất để đánh giá hiệu suất của các tác nhân AI trong quy trình làm việc của doanh nghiệp. Pantera Capital và bộ phận tài sản kỹ thuật số của Franklin Templeton đã tham gia nhóm thử nghiệm ban đầu của Arena.

Sentient cho biết Arena không phải là một bài kiểm tra mô hình tĩnh, mà là một bài kiểm tra nhiệm vụ tiêu chuẩn hóa của tác nhân AI bằng cách mô phỏng các điều kiện doanh nghiệp bao gồm tài liệu dài, thông tin không đầy đủ và các nguồn xung đột. Nền tảng này theo dõi các loại lỗi như ảo giác, thiếu bằng chứng, lỗi trích dẫn và lỗi suy luận để giúp các nhà phát triển chẩn đoán vấn đề. Arena dự định công bố chỉ báo hiệu suất so sánh thông qua bảng xếp hạng công khai và phát hành báo cáo thử nghiệm tóm tắt các chế độ lỗi phổ biến và giải pháp.

Khu vực:
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận