Chuyên viên đánh trải nghiệm trò chơi bàn cờ quy mô lớn đã có mặt! Không chỉ nhanh chóng đưa ra đánh giá và đề xuất, mà còn có thể mô phỏng sự khác biệt trải nghiệm giữa các loại người chơi khác nhau.
Gần đây, một đội ngũ nghiên cứu từ Viện Nghiên cứu Shanda Tokyo, Học viện Đổi mới Thượng Hải, Đại học Nankai và Phòng thí nghiệm Trí tuệ Nhân tạo Thượng Hải đã cùng nhau đề xuất MeepleLM , mô hình thử nghiệm ảo đầu tiên có thể mô phỏng góc nhìn của người chơi thực và đưa ra những lời phê bình mang tính xây dựng dựa trên trải nghiệm chơi game năng động.
Để giảm thiểu cảm giác "không rõ ràng" trong các đánh giá của AI, đội ngũ nghiên cứu đã xây dựng một dữ liệu chuyên dụng bao gồm 1.727 cuốn sách hướng dẫn luật chơi cờ bàn có cấu trúc và 150.000 bài đánh giá thực tế của người chơi, thiết lập mối quan hệ ánh xạ từ "luật chơi khách quan" đến "trải nghiệm chủ quan".
Dựa trên nền tảng này, đội ngũ đã giới thiệu lý thuyết thiết kế trò chơi MDA (Cơ chế-Động lực-Thẩm mỹ) kinh điển để xây dựng cốt lõi của lập luận, cho phép mô hình vượt qua văn bản tĩnh, suy diễn các tương tác động trong quá trình thực thi trò chơi và trích xuất thêm năm hồ sơ người chơi điển hình từ dữ liệu đánh giá, cho phép AI tiếp thu các sở thích cụ thể để mô phỏng cảm giác thực tế của "ngàn khuôn mặt cho ngàn người".
Các thí nghiệm cho thấy MeepleLM vượt trội hơn đáng kể so với các mô hình tổng quát như GPT-5.1 và Gemini3-Pro về độ chính xác trong việc tái tạo danh tiếng và phân bố xếp hạng của người chơi.
Vấn đề "hộp mù" trong thiết kế trò chơi bàn cờ
Ngành công nghiệp trò chơi bàn cờ đang trải qua tăng trưởng nhanh chóng, nhưng quá trình thiết kế của nó vẫn phải đối mặt với những thách thức đáng kể. Không giống như trò chơi điện tử, trải nghiệm trò chơi bàn cờ phụ thuộc rất nhiều vào sự tương tác xã hội giữa người chơi và hiệu ứng phát sinh từ các quy tắc .
Các quy trình thiết kế truyền thống phụ thuộc rất nhiều vào việc thử nghiệm trò chơi bởi con người, điều này không chỉ tốn thời gian và công sức mà còn khó đáp ứng được sở thích của tất cả các loại người chơi. Mặc dù các mô hình tổng quát lớn (LLM) hiện có thể hiểu văn bản, nhưng chúng thường thiếu sự hiểu biết độ sâu về cách các cơ chế trò chơi chuyển hóa thành trải nghiệm cảm xúc. Các đề xuất mà chúng tạo ra thường là những "tuyên bố" mơ hồ hoặc chỉ đơn giản là diễn đạt lại các quy tắc, không cung cấp được những hiểu biết sâu sắc dựa trên các quan điểm khác nhau của người chơi.
Để phá vỡ thế bế tắc này, đội ngũ nghiên cứu đã đề xuất MeepleLM , một công cụ kiểm thử ảo không chỉ có thể hiểu các quy tắc mà còn "mô phỏng bản chất con người".
△
Dạy trí tuệ nhân tạo tư duy như một nhà thiết kế.
Bước đột phá cốt lõi của MeepleLM nằm ở chỗ nó không coi việc đánh giá như một nhiệm vụ tạo văn bản đơn giản, mà thay vào đó xây dựng một Chuỗi nhận thức từ các quy tắc khách quan đến trải nghiệm chủ quan.
1. Dữ liệu chuyên nghiệp chất lượng cao
Đội ngũ đã chọn ra 1.727 trò chơi tiêu biểu, bao gồm các mức độ phức tạp và năm khác nhau, bằng cách sử dụng chiến lược lấy mẫu phân tầng, chuyển đổi các sách hướng dẫn luật chơi dạng PDF không cấu trúc thành các tài liệu có cấu trúc. Kết quả là một dữ liệu chứa 1.727 sách hướng dẫn luật chơi có cấu trúc và 150.000 bình luận chất lượng cao.
Trong khi đó, đối với lượng lớn 1,8 triệu bình luận, đội ngũ đã thiết kế một quy trình xử lý tự động bao gồm lọc cứng, chấm điểm MDA và nhận dạng chiều ngữ nghĩa. Cuối cùng , khoảng 8% lượng dữ liệu chất lượng cao có liên quan độ sâu đến "cơ chế trò chơi" và "trải nghiệm năng động" đã được chọn để đảm bảo mô hình học được "những hiểu biết thực sự trải nghiệm".
△
2. Chuỗi nhận thức MDA (Chuỗi tư duy)
Để giúp mô hình hiểu được nguyên nhân của "niềm vui", MeepleLM giới thiệu khuôn khổ thiết kế trò chơi kinh điển MDA (Cơ học-Động lực-Thẩm mỹ) như một Chuỗi tư duy:
Cơ chế : Luật chơi của trò chơi là gì? (TheWhat)
Động lực : Những tương tác nào xảy ra trong quá trình thực thi quy tắc? (Cách thức)
Tính thẩm mỹ : Tương tác này mang lại trải nghiệm cảm xúc nào cho người chơi? (Cảm nhận)
Thông qua con đường suy luận rõ ràng này, mô hình không còn phỏng đoán nữa, mà thay vào đó suy ra kết quả trải nghiệm một cách logic.
3. Năm hồ sơ người chơi
"Cái này tốt với người này nhưng lại là thuốc độc với người khác." Cùng một cơ chế trò chơi khiến người chơi có phản ứng khác nhau. Thông qua phân tích cụm, đội ngũ nghiên cứu đã xác định được năm hồ sơ người chơi điển hình dựa dữ liệu:
Người theo chủ nghĩa thuần túy hệ thống: Tìm kiếm sự cân bằng và logic tối thượng, và khinh thường sự ngẫu nhiên.
Người theo chủ nghĩa hiệu quả tối ưu: Họ ưu tiên quy trình làm việc trơn tru và không thích các thao tác rườm rà.
Kiến trúc sư kể chuyện: Cách kể chuyện nhập vai và cảm giác hiện diện, với các cơ chế phục vụ chủ đề.
Người kết nối xã hội: Chơi game để giao lưu; thích trò chuyện và tương tác.
Người ưa mạo hiểm: Cảm giác hồi hộp từ rủi ro cao và phần thưởng lớn, niềm vui từ trò chơi xúc xắc.
MeepleLM có khả năng "nhân vật" các hồ sơ người dùng cụ thể này, từ đó cung cấp phản hồi đa dạng với các sở thích riêng biệt.
△
Những người đánh giá ảo hiểu rõ người chơi hơn
Để kiểm chứng kết quả, đội ngũ nghiên cứu đã tiến hành thử nghiệm rộng rãi trên 207 trò chơi (bao gồm cả các trò chơi mới phát hành trong giai đoạn 2024-2025).
△
1. Điều chỉnh điểm số ở cấp độ vĩ mô:
Các mô hình đa năng (như GPT-5.1) thường hoạt động như một "người tốt" khéo léo, có xu hướng cho điểm an toàn từ 7-10. MeepleLM khắc phục được "thiên kiến tích cực" này, nghĩa là nó không chỉ có thể xác định điểm mạnh mà còn nắm bắt chính xác những điểm yếu chí mạng khiến người chơi bỏ cuộc, phản ánh chính xác các mô hình đánh giá phân cực trong cộng đồng thực tế.
△
2. Chất lượng đánh giá ở cấp độ vi mô:
Trong quá trình tạo ra các bình luận, MeepleLM cân bằng giữa tính chính xác về mặt thực tế và sự đa dạng về quan điểm. Như thể hiện trong Hình 6, liên quan đến các bài đánh giá về *One Night of the Ultimate Werewolf*, Qwen3-8B sử dụng giọng điệu chung chung, cường điệu hóa tình cảm ("kịch bi thảm"), trong khi GPT-5.1 lại có giọng điệu khách quan như một nhà báo ("người am hiểu mạng xã hội, chuyên gia xoa dịu dư luận"). Tuy nhiên, MeepleLM đã nắm bắt một cách chân thực giọng điệu độc đáo của từng nhân vật.
Mô hình có thể chuyển đổi liền mạch sang tiếng lóng cộng đồng (ví dụ: "người chơi alpha") trong bối cảnh xã hội và chuyển sang bình luận kỹ thuật (ví dụ: "các quy tắc biến thể") khi đối diện với những người chơi thuần túy, chứng minh rằng nó không chỉ đơn thuần là thu thập kiến thức mà còn thực sự mô phỏng góc nhìn của người chơi.
△
3. Giá trị thực tiễn:
Bằng cách rút quan điểm thực tế từ các bình luận lịch sử và sau đó đối sánh ngữ nghĩa chúng với các bình luận mô phỏng do mô hình tạo ra, kết quả cho thấy MeepleLM có Op-Rec cao nhất, chứng minh giá trị thực tiễn của nó trong việc dự đoán phản hồi thị trường và trình bày các ý kiến đa dạng của người chơi.
Trong một thử nghiệm A/B mù với sự tham gia của 10 loại người chơi khác nhau, MeepleLM đã vượt trội hơn hẳn GPT-5.1 ở các khía cạnh như tính xác thực và sự tự tin khi đưa ra quyết định. Hơn 70% người dùng có xu hướng sử dụng MeepleLM làm tham khảo cho các quyết định mua hàng, cho rằng nó "không giống như lời lẽ tiếp thị" và hiệu quả hơn trong việc xác định các lỗi thiết kế tiềm ẩn.
Một mô hình mới đánh giá các hệ thống tương tác
Bằng cách kết nối các quy tắc tĩnh với trải nghiệm động, MeepleLM thiết lập một mô hình mới cho việc kiểm thử ảo tự động các hệ thống tương tác tổng quát:
Nó có thể đẩy nhanh quá trình thiết kế dựa trên phản hồi dự kiến từ thị trường và giúp người chơi đưa ra lựa chọn cá nhân hóa. Điều này mở đường cho sự hợp tác giữa người và máy tính "nhận thức trải nghiệm", cho phép các mô hình dần dần phát triển từ những công cụ chức năng đơn giản thành những đối tác thấu cảm, có khả năng hiểu được cảm xúc chủ quan của người dùng.
Tên bài báo:
MeepleLM: Một công cụ thử nghiệm ảo mô phỏng nhiều trải nghiệm chủ quan khác nhau.
Liên kết bài báo:
https://arxiv.org/abs/2601.07251
Liên kết dự án:
https://github.com/leroy9472/MeepleLM
Tác giả đầu tiên:
Zizhen Li (Nghiên cứu AI Shanda Tokyo/Đại học Nankai)
Tác giả liên hệ:
Kaipeng Zhang(Shanda AI Research Tokyo)
Bài viết này được đăng tải từ tài khoản WeChat công cộng "Quantum Bit" , do đội ngũ MeepleLM biên soạn và được xuất bản với sự cho phép của 36Kr.





