Thư số 103: Cách lập trình mô hình dự đoán bằng Vibe Code

Bài viết này được dịch máy
Xem bản gốc

Mặc dù không hoàn toàn liên quan đến tiền điện tử, nhưng bài viết này có liên quan đến thị trường dự đoán mà tôi đã từng viết trước đây và tôi tin rằng nó sẽ thu hút sự quan tâm của độc giả. Thêm vào đó, một vài độc giả đã yêu cầu tôi viết một bài đăng như thế này, vì vậy, đây là bài viết đó!

Tôi đã dành vài tuần qua để xây dựng một mô hình dự đoán nhằm xác định ai sẽ thắng trong các trận đấu cạnh tranh của Dota 2 (một trò chơi điện tử thể thao điện tử). Tôi đã thực hiện tất cả bằng phương pháp lập trình cảm tính với Claude Code (với một chút trợ giúp từ Yoshi thông qua openclaw, nhưng hoàn toàn có thể thực hiện trực tiếp bằng CC). Tôi không có bằng cấp về máy học và không có kiến ​​thức về khoa học dữ liệu.

Mặc dù còn sớm, nhưng kết quả trông rất khả quan. Tôi đã kiểm tra lại mô hình và kết quả thực sự rất tuyệt vời . Thành thật mà nói, chúng trông quá tốt đến mức khó tin, vì vậy hãy đón nhận điều này với một thái độ hoài nghi:

Tôi đã theo dõi kết quả thực tế trong vài tuần với khoảng 100 lần đặt cược thực tế được ghi lại, và mô hình đang hoạt động tốt cho đến nay (~7,5% ROI), vì vậy tôi hy vọng mọi thứ sẽ tiếp tục diễn ra tốt đẹp. Nhưng tôi biết vẫn còn quá sớm để kết luận.

Có rất nhiều người ngoài kia đang rao bán những lời quảng cáo về việc Bots giao dịch trên Polymarket của họ có thể kiếm được 6 con số mỗi tuần và khiến mọi người nghĩ rằng điều đó rất dễ dàng. Thực tế không dễ dàng, nó đòi hỏi thời gian, sự tận tâm, động lực và nỗ lực. Bạn phải sẵn sàng học hỏi, nó không đơn giản như kiểu "Này Claude, hãy xây dựng cho tôi một mô hình dự đoán kiếm tiền". Ngay cả khi bạn có một mô hình như vậy, bạn vẫn phải thử nghiệm liên tục và đảm bảo rằng nó thực sự hoạt động. Bạn phải bảo trì, cập nhật nó, và ngay cả khi đó , bạn vẫn sẽ gặp phải vấn đề thanh khoản khi đặt cược/dự đoán, và nó không bao giờ đơn giản như việc kiếm được 6 con số mỗi tuần.

Tôi đã dành gần 2 tháng mỗi ngày để làm việc với mô hình của mình, trung bình hơn 5 tiếng đồng hồ. Có rất nhiều công việc tỉ mỉ và những lúc nản lòng. Nhưng tôi tin rằng tiềm năng là có, bất cứ ai cũng có thể làm được những gì tôi đã làm và xây dựng một mô hình (hy vọng) sẽ sinh lời.

Hôm nay tôi sẽ hướng dẫn các bạn cách thức hoạt động của các mô hình dự đoán, cách tôi tạo ra mô hình của mình và cách các bạn có thể tạo ra mô hình của riêng mình bằng sức mạnh của lập trình cảm xúc.

Tôi sẽ phân tích các thành phần cốt lõi mà mọi mô hình dự đoán thành công cần có, cùng với một số gợi ý bổ sung về cách xây dựng và phát triển chúng trong thực tế:

  1. Hãy bắt đầu bằng một câu hỏi rõ ràng và được xác định cụ thể.

  2. Hãy nhờ AI hỗ trợ bạn từng bước một.

  3. Bạn cần dữ liệu đáng tin cậy và sạch sẽ.

  4. Đặc điểm của bạn là tất cả

  5. Lựa chọn mô hình phù hợp

  6. Điều chỉnh siêu tham số

  7. Ngăn chặn rò rỉ dữ liệu

  8. Phân chia thời gian tập luyện và kiểm tra hợp lý.

  9. Các chỉ số đánh giá

  10. Hiệu chỉnh tốt

  11. Chu kỳ lặp nhanh

  12. Một quy trình đào tạo lại

  13. Kiểm tra và giám sát trong môi trường thực tế

  14. Tổng hợp lại tất cả

Chúng ta cùng bắt đầu nào.

Lưu ý: Tôi đang trong quá trình ra mắt một cộng đồng giáo dục mới dành cho những người muốn tìm hiểu về Trí tuệ Nhân tạo (AI). Tôi có hai người đồng sáng lập đã xây dựng và giảng dạy về AI trong nhiều năm, và trong số những hoạt động khác, chúng tôi sẽ tổ chức 8 buổi hội thảo trực tuyến mỗi tuần .

Chúng tôi vẫn đang trong giai đoạn đầu, nhưng chúng tôi đang nhận thêm thành viên mới. Có một ưu đãi đặc biệt dành cho người đăng ký gói cao cấp mà tôi sẽ chia sẻ ở cuối bản tin này, đó là giảm giá 70% so với giá cuối cùng mà chúng tôi dự kiến.

Sản phẩm sẽ chính thức ra mắt vào khoảng cuối tháng này, nên hãy chú ý theo dõi nhé! Mình rất hào hứng về điều này!


1. Bắt đầu với một câu hỏi rõ ràng và cụ thể.

Sai lầm lớn nhất mà mọi người thường mắc phải khi nghe đến "mô hình dự đoán" là họ bắt đầu nghĩ về thuật toán, khung phần mềm và lợi nhuận. Đừng làm vậy. Thay vào đó, hãy nghĩ về câu hỏi mà bạn đang cố gắng trả lời.

Ai thắng trong trận đấu Dota 2 này? là một câu hỏi hay. Nó mang tính nhị phân và có thể đo lường được. Bạn biết khi nào mình đoán đúng và khi nào mình đoán sai.

"Điều gì sẽ xảy ra trong thế giới tiền điện tử tuần này?" là một câu hỏi không hay. Nó quá mơ hồ, và không có tiêu chí thành công hay thất bại rõ ràng. Bạn thậm chí còn khó biết cần thu thập dữ liệu gì.

Chất lượng câu hỏi của bạn quyết định chất lượng của tất cả những gì tiếp theo.

Một điểm khởi đầu tốt là tự hỏi bản thân:

Nếu bạn có câu trả lời rõ ràng cho cả bốn câu hỏi, bạn sẽ có thể đưa ra một câu hỏi hay mà bạn sẽ sử dụng mô hình dự đoán để trả lời.

Nếu bạn đang cố gắng xây dựng một mô hình để đặt cược và kiếm tiền, thì tôi nghĩ tốt nhất nên bắt đầu với thứ mà bạn đã có kiến ​​thức và chuyên môn sẵn có.

Tôi chọn Dota 2 vì đây là trò chơi điện tử tôi đã chơi hơn 20 năm, từng cá cược cho vui (rất nhiều lần; tôi đã thua rất nhiều tiền khi cá cược trò chơi chết tiệt này trong những năm qua, haha, nhưng giờ tôi có thể trả thù rồi!!), đã xem người khác chơi hơn 10 năm và hiểu rõ trò chơi này đến từng chi tiết. Tôi biết nhiều về trò chơi này hơn đại đa số mọi người, thậm chí còn hơn cả hầu hết những người thường xuyên xem nó. Một số kiến ​​thức đó có thể hữu ích khi tìm kiếm lợi thế sau này.

Trí tuệ nhân tạo giúp ích như thế nào?

Bạn có thể mô tả lĩnh vực quan tâm chung của mình cho bất kỳ AI nào và yêu cầu nó giúp bạn xây dựng một câu hỏi cụ thể. Hãy yêu cầu nó hướng bạn đến sự cụ thể hơn. Hãy cho nó biết lĩnh vực của bạn và những quyết định bạn muốn đưa ra, và nó sẽ giúp bạn tìm ra câu hỏi bạn muốn trả lời.

Thật ra, bạn chỉ cần sao chép toàn bộ phần này vào AI và nói kiểu như “Tôi cần giúp đỡ để nghĩ ra một câu hỏi hay, tôi muốn tạo một mô hình dự đoán, bạn có thể giúp tôi không?” rồi bắt đầu từ đó. Một chủ đề chung mà bạn sẽ nhận thấy xuyên suốt bài viết này là bạn có thể và nên…

2. Hãy nhờ AI hỗ trợ bạn trong từng bước.

Tự mình làm tất cả mọi việc sẽ chẳng có gì đáng tự hào. Trí tuệ nhân tạo (AI) là công cụ mạnh mẽ nhất trên thế giới, hãy sử dụng nó, và sử dụng thật tốt.

Vậy nên, sau khi đã chọn được câu hỏi muốn trả lời, đã đến lúc bạn tải nền tảng mã hóa cảm xúc mà mình lựa chọn lên và bắt đầu yêu cầu AI hỗ trợ thêm. Tôi đã viết về Claude Code vài tuần trước và đó là nơi tôi xây dựng mô hình của mình. Tôi khuyên bạn nên sử dụng Claude Code với Opus 4.6 hoặc Codex với GPT 5.4 vì hiện tại chúng là hai mô hình tiên tiến nhất trong lĩnh vực mã hóa.

Dĩ nhiên bạn có thể thử với những mẫu máy kém hơn và thử nghiệm (và đó là một cách tuyệt vời để học hỏi), nhưng nếu bạn đang cố gắng kiếm tiền, tôi thực sự nghĩ bạn sẽ muốn sử dụng những mẫu máy cao cấp nhất.

Sau khi vào Claude Code/Codex, hãy tạo một dự án mới và bắt đầu bằng cách cho nó biết những gì bạn muốn, dựa trên câu hỏi mà bạn đã đặt ra. Ví dụ như:

Tôi muốn xây dựng một mô hình dự đoán Dota 2 để giúp dự đoán đội nào sẽ thắng trong một trận đấu. Tôi muốn bạn giúp tôi việc này. Hãy bắt đầu bằng cách nghiên cứu kỹ lưỡng để tìm hiểu mọi thứ bạn có thể về việc xây dựng mô hình dự đoán; cụ thể là các mô hình Dota 2 và thể thao điện tử. Hãy xem xét các bài báo nghiên cứu và bất kỳ bằng chứng nào về các mô hình thành công khác mà chúng ta có thể học hỏi. Chia sẻ các nguồn và bằng chứng đó với tôi. Hãy tổng hợp tất cả thông tin đó và lập một kế hoạch từng bước cho chúng ta và cho tôi biết chúng ta cần gì để bắt đầu.

Trí tuệ nhân tạo (AI) sẽ làm rất tốt việc lập kế hoạch từ đây, nhưng một điều tôi thấy rất hữu ích và quan trọng là tự mình đọc các nguồn tài liệu và bài nghiên cứu ( hoặc ít nhất là một vài bài). Tôi biết tất cả chúng ta đều đang tự rèn luyện bản thân để dựa vào các bản tóm tắt và gạch đầu dòng của AI, nhưng bạn thực sự cần hiểu một Bit về cách mọi thứ hoạt động bên trong; điều đó sẽ cực kỳ hữu ích khi bạn tiến về phía trước.

Tôi hy vọng phần còn lại của bức thư này sẽ cung cấp cho bạn một số bối cảnh và giúp bạn hiểu rõ hơn về những vấn đề này.

3. Bạn cần dữ liệu đáng tin cậy và sạch sẽ.

Mô hình của bạn học hỏi từ dữ liệu. Nếu dữ liệu sai, không đầy đủ hoặc không nhất quán, mô hình sẽ học được những điều sai lệch.

Đối với mô hình Dota 2 của tôi, tôi lấy phần lớn dữ liệu từ các API chính thức. Tôi luôn khuyên nên tìm kiếm các API tốt để lấy dữ liệu thay vì thu thập dữ liệu từ web. Đối với Dota, API tôi sử dụng có dữ liệu trận đấu toàn diện kéo dài nhiều năm. Bao gồm đội hình, chỉ số người chơi, kết quả trận đấu, thông tin cập nhật và nhiều hơn nữa. Dữ liệu được cấu trúc tốt, được ghi chép đầy đủ và cập nhật thường xuyên.

Thật không may (hoặc có thể là may mắn, vì điều này có thể tạo ra cơ hội), không phải mọi lĩnh vực đều có API tiện lợi dành cho bạn. Đôi khi bạn phải tự thu thập dữ liệu từ các trang web, phân tích PDF hoặc làm việc với các bảng tính phức tạp.

Thông thường, bạn vẫn phải làm Bit hai việc (tôi cũng thu thập dữ liệu thủ công, mặc dù 95% đến từ API).

Tóm lại, định dạng không quan trọng bằng độ tin cậy. Bạn cần tin tưởng rằng dữ liệu phản ánh chính xác những gì đã xảy ra. Sử dụng API dễ hơn, nhưng không phải là cách duy nhất để đạt được điều này.

Bên cạnh dữ liệu đáng tin cậy, dữ liệu sạch cũng rất quan trọng. Điều này có nghĩa là: không có bản ghi trùng lặp, định dạng nhất quán, không có giá trị thiếu trong các trường quan trọng và tài liệu rõ ràng về ý nghĩa của từng trường.

Trí tuệ nhân tạo giúp ích như thế nào?

Hãy yêu cầu nó viết các bài kiểm tra chất lượng dữ liệu. Ví dụ: “Hãy viết một Script để tải dữ liệu trận đấu của tôi, kiểm tra các bản ghi trùng lặp, đánh dấu bất kỳ trận đấu nào thiếu ID đội và hiển thị cho tôi sự phân bố các trận đấu theo tháng.” Bạn thậm chí có thể yêu cầu đơn giản hơn, chẳng hạn như “Tôi muốn đảm bảo dữ liệu của chúng ta sạch sẽ và đáng tin cậy, chúng ta có thể làm điều đó như thế nào?” và nó sẽ đưa ra một số gợi ý và kế hoạch, và bạn có thể tiếp tục từ đó.

4. Đặc điểm của bạn là tất cả

Các đặc trưng là một trong những yếu tố quan trọng nhất cần hiểu khi xây dựng mô hình dự đoán. Nói một cách ngắn gọn, các đặc trưng là dữ liệu đầu vào mà mô hình sử dụng để đưa ra dự đoán. Dữ liệu thô hiếm khi hữu ích khi đứng riêng lẻ. Bạn cần dữ liệu thô vì đó là thứ được sử dụng để tạo ra các đặc trưng, ​​nhưng chính các đặc trưng mới là thứ thực sự được sử dụng để dự đoán mọi thứ.

Đối với Dota 2, một thống kê thô như "đội A đã chơi 200 trận" hầu như không cho bạn biết gì về việc ai sẽ thắng trận tiếp theo. Nhưng "đội A đã thắng 65% trong 20 trận gần nhất ở bản cập nhật hiện tại" lại cho bạn biết điều gì đó hữu ích về phong độ gần đây trong meta hiện tại.

Đây là lúc kiến ​​thức chuyên môn của bạn phát huy tác dụng. Bạn hiểu rõ lĩnh vực của mình. Bạn biết những yếu tố nào ảnh hưởng đến kết quả. Nếu bạn là một người hâm mộ golf thực thụ, bạn biết rằng thời tiết có tác động, loại cỏ tạo nên sự khác biệt, việc người chơi bắt đầu vào buổi sáng hay buổi chiều có thể thay đổi khả năng ghi điểm tốt của họ, bạn biết rằng những người đánh xa sẽ chơi tốt hơn trên một số sân, v.v.

Mô hình của bạn ban đầu không biết bất cứ điều gì trong số này. Nó chỉ biết những gì bạn cung cấp cho nó thông qua các đặc trưng.

Các đặc điểm tốt nắm bắt thông tin có sẵn trước khi dự đoán, có liên quan đến kết quả và không trùng lặp với các đặc điểm khác.

Trí tuệ nhân tạo giúp ích như thế nào?

Hãy yêu cầu hệ thống đề xuất các tính năng như một điểm khởi đầu, để bạn có cái nhìn tổng quan về các loại công cụ bạn có thể sử dụng. Sau đó, mô tả chuyên môn của bạn và các yếu tố mà bạn cho là quan trọng để cùng nhau lên ý tưởng và lập danh sách các tính năng bổ sung mà bạn nghĩ có thể ảnh hưởng đến kết quả.

Sau đó, hãy yêu cầu nó tạo ra các tính năng đó từ dữ liệu thô của bạn. Nó sẽ viết mã chuyển đổi. Bạn đánh giá xem các tính năng đó có hợp lý hay không. Quá trình trao đổi qua lại này chính là điểm mạnh của lập trình dựa trên cảm nhận. Bạn đóng góp tư duy (ít nhất là một phần) và kiến ​​thức chuyên môn của mình. Trí tuệ nhân tạo sẽ làm mọi thứ còn lại.

5. Chọn mô hình phù hợp

Bạn có câu hỏi, dữ liệu và các đặc điểm. Bây giờ bạn cần một thứ gì đó để lấy những đặc điểm đó và biến chúng thành một dự đoán. Thứ đó chính là mô hình.

Hãy coi mô hình như một hàm số. Bạn cung cấp cho nó các đầu vào (các đặc trưng) và nó sẽ trả về cho bạn một đầu ra (một dự đoán). Các loại mô hình khác nhau học hàm số này theo những cách khác nhau. Một số thì đơn giản, một số thì phức tạp. Lựa chọn đúng đắn phụ thuộc vào vấn đề của bạn, nhưng đối với hầu hết các nhiệm vụ dự đoán với dữ liệu có cấu trúc, câu trả lời đơn giản hơn bạn nghĩ.

Đọc thêm

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
78
Thêm vào Yêu thích
18
Bình luận