Grok 4.20 Beta xếp hạng #2 với điểm số chính xác 97% trên 𝜏²-Bench dành cho lĩnh vực Viễn thông (Sử dụng Công cụ Đại lý). Nó vượt trội hơn Claude Opus 4.6 (tối đa), GPT-5.4 (rất cao) và Gemini 3.1 Pro, đồng thời tiến gần đến điểm số cao nhất GLM-5 về quy trình làm việc của tác nhân. Gọi công cụ là toàn bộ vấn đề đối với các tác nhân AI, và đây là nơi Grok 4.20 phát huy vai trò của mình. Với trí tuệ nhân tạo tiên tiến khởi động tức thì, nó trở thành thiết bị nhanh nhất trong ngành về tốc độ xử lý token mỗi giây.
Bài viết này được dịch máy
Xem bản gốc

Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan



