上周我向大家讲解如何从零开始写一个预测模型。
反应非常好,很多人开始制作自己的模型,这真是太棒了。
我本周收到的一些问题类似于“我应该尝试预测什么?”以及“一旦模型运行起来,是否就应该盲目地遵循它?”
所以我决定再多写一些关于领域知识的概念,因为它能回答这两个问题以及更多问题。
领域知识是构成(或应该构成)任何模型的基础层,也是建构模型的基础。它区分了拥有模型的人、拥有优秀模型的人以及能够有效利用模型的人。
这是你对自己专业领域所了解的、任何资料集都无法完全捕捉的知识。例如背景、细微差别、特殊情况等等。这些东西难以量化,但如果你在某个领域投入了数千小时,就很容易辨认出来。
我认为,在使用预测模型的过程中,理解如何以及何时运用你的领域知识是最重要的技能之一。这也是我在不断完善我的Dota 2模型并追踪真实投注数据时一直在思考的问题。
顺便说一句,我的模型持续证明它相当有利可图。以下是最新结果。虽然现在还处于早期阶段,但我对它的信心正在稳步增长:
已经下了137注,而且获利了。不到500注我都不会觉得太放心,可能要到1000注以上才会真正放心,但是…我们正在朝著目标前进。
1. 领域知识究竟是什么?
领域知识是指你透过经验、观察和参与所累积的关于某个主题的所有知识。它存在于你的脑海中,很难用电子表格、JSON 档案或 Python 程式码来表达。
对我而言,在 Dota 2 领域,这些知识来自我 20 多年的游戏经验和数千小时观看职业比赛的累积。以下是一些领域知识的例子:
模型看到的是数据:胜率、英雄对战、近期状态、历史表现。它能很好地处理这些数据。但它实际上并不观看比赛,不观看赛前赛后采访,它也不理解……姑且称之为「氛围」吧。





