Grok 4 dự đoán Dodgers sẽ giành chiến thắng tại World Series—Nhưng các AI khác thì không chắc chắn như vậy

avatar
Decrypt
07-12
Bài viết này được dịch máy
Xem bản gốc

Trong số các bản demo mà Elon Musk giới thiệu trong buổi ra mắt Grok 4 vào ngày 9 tháng 7 có một câu hỏi thú vị yêu cầu AI dự đoán đội nào sẽ chiến thắng giải World Series của Giải bóng chày Quốc gia vào cuối năm nay.

Sau 4,5 phút phân tích dữ liệu từ Polymarket, nền tảng thị trường dự đoán dựa trên Ethereum và sử dụng khả năng lý luận "Nặng" theo cách gọi của xAI, Grok 4 đã đưa ra phán quyết: Đội Los Angeles Dodgers có khả năng cao nhất chiến thắng World Series 2025. Grok đưa ra mức xác suất 21,6% cho L.A. chiến thắng - cao hơn bất kỳ đội nào khác, nhưng vẫn ghi nhận rằng họ có thể bị định giá quá cao.

Các dự đoán của Grok hoàn toàn phù hợp với các nền tảng chính, bao gồm ESPN BET, cho thấy Dodgers đang ở mức +225 khi mùa MLB đang đến gần giải nghỉ All-Star. Đội Detroit Tigers (+750), đang dẫn đầu khu vực AL Central, đã trở thành ứng cử viên dark horse với thành tích tốt nhất bóng chày là 59-35.

Các nhà giao dịch trên X rất phấn khích về khả năng có một "Grokstradamus" cá nhân và gọi kết quả này là "lỗ hổng tiền vô hạn".

Nhưng chúng tôi muốn biết: Các mô hình AI chính khác có đồng ý với Grok không?

Hóa ra, không hoàn toàn.

Mô hình o3 của ChatGPT đưa ra cho Dodgers 26% cơ hội trong khi cảnh báo họ bị định giá quá cao. Mô hình xác định Detroit là đội có giá trị nhất với 16% khả năng chiến thắng so với tỷ lệ thị trường chỉ là 12,5%. Lý luận của nó tập trung vào sự thống trị của Tarik Skubal và đội ngũ pitching hàng đầu giải.

DeepSeek tăng cường ủng hộ Los Angeles với xác suất 23%, nhưng lưu ý Dodgers có thể đang nhận được quá nhiều cảm xúc tích cực. Mặc dù ưu tiên LA chiến thắng, nhưng mô hình cho rằng nên đặt cược vào Phillies vì tỷ lệ rủi ro-phần thưởng hấp dẫn hơn.

Vì chúng tôi nghèo và những người trả lương không có khả năng phê duyệt gói đăng ký $300 của Grok 4 Heavy chỉ để trả lời một câu hỏi, nên chúng tôi đã hỏi phiên bản Grok 4 nhẹ hơn có sẵn với mức giá $30. Thú vị thay, nó cho Tigers lợi thế mỏng manh hơn Dodgers - khoảng cách giữa các tỷ lệ chưa đến một điểm phần trăm.

Cả ba mô hình đều chỉ ra các yếu tố tương tự: đội hình pitching hàng đầu của Detroit, những lo ngại về chấn thương của Dodgers và các mẫu lịch sử cho thấy thị trường đánh giá quá cao các nhà vô địch đương nhiệm.

Mặc dù lý luận "Nặng" của Grok 4 rất ấn tượng, nhưng bạn không cần một gói $300/tháng để có được các dự đoán chính xác. Với việc nhắc nhở thông minh, thậm chí các mô hình cơ bản cũng có thể cung cấp những hiểu biết sắc sảo. Chúng tôi nhận thấy rằng các lời nhắc thành công cần ít nhất ba yếu tố chính:

Đầu tiên, vai diễn. Hãy cho mô hình biết ai nó nên là và như thế nào nó nên hành động. Hãy thử như sau: "Bạn là một Chuyên gia Phân tích Thị trường Dự đoán với kiến thức sâu rộng về dự báo Bayesian và quản lý rủi ro."

Thứ hai, phương pháp: Cho mô hình biết cái gì bạn muốn và các bước nó nên thực hiện để thành công. Yêu cầu mô hình thu thập tỷ lệ cược hiện tại từ nhiều nguồn, so sánh chúng với các dự báo phân tích và xác định các khoản cược có giá trị. Các mô hình hoạt động tốt hơn khi có thể so sánh consensus thị trường với các tính toán của riêng chúng.

Đây là những gì các kỹ sư nhắc nhở gọi là Chuỗi Suy nghĩ - nếu mô hình biết chính xác phải làm gì, nó sẽ cung cấp kết quả tốt hơn. Không biết cách hướng dẫn? Hãy hỏi mô hình riêng về các bước cần thiết để hoàn thành nhiệm vụ của bạn.

Thứ ba, hướng tới các nguồn phân tích. Việc đề cập đến các mô phỏng của Baseball-Reference hoặc các dự báo của FanGraphs giúp định hướng dự đoán trong các khuôn khổ đã được thiết lập, thay vì thuần túy đoán mò.

Đối với những người muốn thử nghiệm điều này, chúng tôi đã xây dựng một GPT tùy chỉnh để sao chép những gì xAI đã chứng minh với Grok 4. Đó chỉ là một thử nghiệm vui vẻ, nhưng nó thu thập tỷ lệ, phân tích hiệu suất đội và xác định giá trị cá cược tiềm năng thông qua cuộc trò chuyện tự nhiên.

Chúng tôi cũng đã đăng lời nhắc thị trường dự đoán của mình trên GitHub nếu bạn muốn thử nghiệm với chatbot của riêng mình.

Sử dụng với rủi ro của riêng bạn. Chúng tôi không phải là cố vấn tài chính, và các AI này cũng vậy. Nếu bạn thua, đừng đổ lỗi cho chúng tôi - nhưng nếu nó giúp bạn thắng lớn, chúng tôi sẽ không từ chối một ly bia.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận