Kaggle ra mắt Game Arena để đánh giá AI thông qua các trò chơi chiến lược cạnh tranh

Bài viết này được dịch máy
Xem bản gốc
Kaggle Rolls Out Game Arena To Benchmark AI Through Competitive Strategy Games

Nền tảng trực tuyến dành cho các chuyên gia khoa học dữ liệu và học máy, Kaggle, đã giới thiệu Kaggle Game Arena, một nền tảng đánh giá nơi các mô hình và đại lý AI cạnh tranh trong các trò chơi chiến lược một-chọi-một để nâng cao các phương pháp đánh giá AI đáng tin cậy.

Trong nền tảng này, các hệ thống AI hàng đầu như o3, Gemini 2.5 Pro, Claude Opus 4 và Grok 4 tham gia các trận đấu được phát trực tiếp và có thể phát lại trong các môi trường trò chơi được xác định bởi các mục tiêu có cấu trúc, bộ quy tắc, hệ thống quản lý trạng thái và các bộ đánh giá, tất cả đều được hỗ trợ bởi cơ sở hạ tầng của Kaggle.

Các giao diện trực quan điều chỉnh hiển thị gameplay cho từng tiêu đề, trong khi kết quả từ các giải đấu mô phỏng này được công bố dưới dạng bảng xếp hạng chuyên dụng theo Kaggle Benchmarks, xếp hạng các mô hình theo các thước đo hiệu suất như xếp hạng Elo.

Sáng kiến này tận dụng thế mạnh của các trò chơi như các công cụ đánh giá bằng cách cung cấp các môi trường chống lại sự bão hòa hoàn toàn - các trò chơi phức tạp như cờ vua hoặc cờ vây tăng độ khó khi các đối thủ cải thiện, trong khi các trò chơi suy luận xã hội như Người sói đánh giá các khả năng liên quan đến các bối cảnh doanh nghiệp, bao gồm cả việc xử lý thông tin không đầy đủ và cân bằng sự hợp tác với cạnh tranh.

Các trò chơi còn đóng vai trò là đại diện cho các kỹ năng thực tế đa dạng, kiểm tra các năng lực trong lập kế hoạch chiến lược, suy luận, thích ứng, lừa dối, trí nhớ và lý thuyết về tâm trí. Các kịch bản nhiều người chơi còn đo lường khả năng phối hợp và giao tiếp.

Đáng chú ý, Kaggle đã hợp tác với Google DeepMind, nổi tiếng với các cột mốc AI bao gồm AlphaGo và AlphaZero, để thiết kế các môi trường và bộ đánh giá mã nguồn mở, với DeepMind phục vụ như một đối tác nghiên cứu và cố vấn trong việc tạo ra bộ đánh giá Game Arena.

Chúng tôi có một lịch sử lâu dài về việc sử dụng các trò chơi để đo lường tiến bộ trong AI. 🎮

Đó là lý do tại sao chúng tôi đang giúp ra mắt Kaggle Game Arena: một nền tảng mã nguồn mở nơi các mô hình cạnh tranh trực tiếp với nhau trong các trò chơi phức tạp để giúp chúng ta đánh giá khả năng của chúng. 🧵pic.twitter.com/9xFB1OuZoF

— Google DeepMind (@GoogleDeepMind) Ngày 4 tháng 8 năm 2025

Kaggle Game Arena Ra Mắt Với Giải Đấu Cờ Vua AI Kéo Dài 3 Ngày Với Sự Tham Gia Của Các Huyền Thoại Cờ Vua Và Các Mô Hình AI Hàng Đầu

Việc ra mắt nền tảng sẽ được đánh dấu bằng một giải đấu triển lãm cờ vua AI kéo dài 3 ngày tại Game Arena, được tổ chức phối hợp với Chess.com, Take Take Take và các nhân vật cờ vua nổi tiếng bao gồm Levy Rozman, Hikaru Nakamura và Magnus Carlsen.

Diễn ra từ ngày 5 đến 7 tháng 8, sự kiện sẽ có sự tham gia của các mô hình AI hàng đầu cạnh tranh trong các trận đấu trực tiếp, với các trò chơi được phát trực tiếp hàng ngày lúc 10:30 sáng giờ PT tại kaggle.com/game-arena.

Bình luận và phân tích chuyên sâu sẽ đi kèm với giải đấu, với Hikaru Nakamura cung cấp bản tin phát trực tiếp hàng ngày trên luồng Kick của mình, đồng thời cũng được hiển thị trên trang chủ Chess.com. Người xem có thể theo dõi các trận đấu theo thời gian thực thông qua ứng dụng Take Take Take, ứng dụng này tiết lộ suy luận của mô hình AI, có sẵn trên Apple App Store và Google Play. Levy Rozman sẽ xuất bản các bản tóm tắt và phân tích hàng ngày trên kênh YouTube của mình, trong khi trận chung kết và tổng quan giải đấu sẽ được Magnus Carlsen phát trực tiếp trên kênh YouTube Take Take Take.

Bài viết Kaggle Rolls Out Game Arena To Benchmark AI Through Competitive Strategy Games đã xuất hiện đầu tiên trên Metaverse Post.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận