上週我向大家講解如何從零開始寫一個預測模型。
反應非常好,很多人開始製作自己的模型,這真是太棒了。
我本週收到的一些問題類似於“我應該嘗試預測什麼?”以及“一旦模型運行起來,是否就應該盲目地遵循它?”
所以我決定再多寫一些關於領域知識的概念,因為它能回答這兩個問題以及更多問題。
領域知識是構成(或應該構成)任何模型的基礎層,也是建構模型的基礎。它區分了擁有模型的人、擁有優秀模型的人以及能夠有效利用模型的人。
這是你對自己專業領域所了解的、任何資料集都無法完全捕捉的知識。例如背景、細微差別、特殊情況等等。這些東西難以量化,但如果你在某個領域投入了數千小時,就很容易辨認出來。
我認為,在使用預測模型的過程中,理解如何以及何時運用你的領域知識是最重要的技能之一。這也是我在不斷完善我的Dota 2模型並追蹤真實投注數據時一直在思考的問題。
順便說一句,我的模型持續證明它相當有利可圖。以下是最新結果。雖然現在還處於早期階段,但我對它的信心正在穩步增長:
已經下了137注,而且獲利了。不到500注我都不會覺得太放心,可能要到1000注以上才會真正放心,但是…我們正在朝著目標前進。
1. 領域知識究竟是什麼?
領域知識是指你透過經驗、觀察和參與所累積的關於某個主題的所有知識。它存在於你的腦海中,很難用電子表格、JSON 檔案或 Python 程式碼來表達。
對我而言,在 Dota 2 領域,這些知識來自我 20 多年的遊戲經驗和數千小時觀看職業比賽的累積。以下是一些領域知識的例子:
模型看到的是數據:勝率、英雄對戰、近期狀態、歷史表現。它能很好地處理這些數據。但它實際上並不觀看比賽,不觀看賽前賽後採訪,它也不理解……姑且稱之為「氛圍」吧。





