世界杯小组赛即将结束,你还相信AI吗?
爆冷频出,黑马击败强手。 许多人工智能模型是出乎意料的。
我们还能愉快地找到科学定律吗? 换句话说,在人工智能的支持下,数据科学家能在多大程度上预测足球比赛甚至其他竞技体育赛事?
瓶颈是缺乏核心数据
如果你让谢波回答这个问题,他会告诉你:“仅用神经网络模型很难预测世界杯的结果和比分。”
谢波是北京乖柴科技的首席执行官。 他认为,世界杯很难预测,最根本的原因是缺乏核心数据:例如,国家队之间的历史交锋记录非常稀疏,无法提供足够的信号来支持预测结果。
以本届世界杯揭幕战俄罗斯与沙特的比赛为例。 两队上次交锋是1993年的一场友谊赛,距今已有25年历史。 基于这样的数据,神经网络模型很难发挥其威力。
但足球比赛的预测也并非完全没有希望。 经过实践实践,谢博团队发现,如果以包括五大联盟在内的职业联赛作为预测样本,效果会有很大差异。
五大联赛是指欧洲五大职业足球联赛,包括英超、西甲、德甲、法甲和意甲。这些联赛拥有较为完善的商业化体系以及较为先进的数据收集和数据流通的商业化机制。
所以第一步就是获取数据。
相对具有挑战性的是,与金融等其他领域相比,体育行业的数据具有来源众多、标准不一、置信度参差不齐的特点,难以从权威机构获得全面、准确、标准化的数据。数据公司。 数据。
例如,描述游戏的赔率数据和基本数据存在于不同的来源。 不同来源的数据需要通过非常严格的数据流程进行关联和处理。 只有最简单的字段,团队名称,在不同的来源中有不同的名称。 任何微小的数据偏差或丢失都会导致最终的神经网络预测结果出现偏差。 ,影响准确度。 这里的技术工作非常具有挑战性。
此外,还必须考虑足球比赛的实时性。 因此,在积累了过去10年欧洲主流联赛数万场比赛的历史数据后,的模型还加入了数百万场比赛中的实时数据。
然后进入第二步,预测回报率取向。
体育博彩领域存在一些常见的误解。 例如,某场比赛的赔率是博彩公司综合考虑比赛本身以及公众投注选择等因素后给出的比赛投注回报。
例如,博彩公司提供主队获胜的赔率是2.25,这意味着如果投注者投注主队获胜,并且比赛结果是主队获胜,那么投注者可以获得回报其赌注金额的 2.25 倍。
对比赛的结果做出一定的判断,给出一定的概率估计JRS直播,这里预测的是概率。
在此基础上,一个更重要的概念就是价值回报率。 该指标考虑了结果的赔率和概率。 对于每场比赛,胜利或失败的同等结果是相应赔率和预测概率的乘积。 。
价值回报率可以认为是赔率的套利空间,或者说是赔率的预期回报值。
所以从预测回报率的角度来看,公式如下:
= 最大 { Σ 赔率 | Pro, Val, α },其中Odds为预测结果的几率,Pro为预测概率,Val为预测值回报,α为选择的策略。
接下来,你可以看一下这个专门为预测而构建的模型,它分为两部分:
基于深度学习技术的比赛预测模型,基于价值回报率的投注策略模型。
一一看看。
基于深度学习的比赛成绩预测模型
深度学习技术作为传统神经网络算法的延伸和扩展,在图像识别、语音识别、自然语言处理等领域取得了巨大成功。
将深度学习技术引入足球比赛结果预测中,可以综合利用历史比赛记录和各种实时数据信息进行训练和计算。 经过数万场比赛和海量数据分析,我们可以学会掌握决定胜负的关键因素。
无论是球员赛前受伤,还是教练的奇怪举动,都可以从海量数据中获得无数线索,帮助模型获得准确的预测结果。
△图:基于深度神经网络的比赛预测
乖乖科技目前的深度学习模型已经过过去20000多场比赛的训练,使用了一百多个维度的特征,包括球队的基本面(射门数、抢断数、助攻数、控球率等) .),来自各个渠道的数十种赔率信息(欧洲赔率、亚洲赔率等),以及历史结果。
经过神经网络的编码和序列解码,以及引入有效的注意力机制,可以对比赛结果(包括结果和分数)进行准确的预测。
此外,团队随后使用多组子模型对结果进行多级融合,以获得最大的性能增益。 目前最好的模型可以稳定达到68%的预测精度。 已经超越了人类专家的顶尖水平。
介绍寻找具有价值回报的最佳投资组合
当结果的概率和赔率已知时,选择哪些比赛进行投注以及投注的比例就是投注策略所关心的。
不同的预测概率将会有不同的价值回报。 根据不同的价值回报,我们会采取不同的投注策略,这就涉及到一个最优投资组合的搜索问题。
搜索空间基于赔率、预测概率、值返回和不同预测模型的组合。 如何在数以百万计的投资组合中进行最优搜索成为核心问题。
△图:基于遗传算法的参数组合搜索
Guess 采用剪枝优化策略,结合遗传算法等多种搜索策略,搜索最优参数空间。
遗传算法等并不基于梯度进行计算,算法本身可以扩展到巨大的参数空间。 重点设计和优化算法的初始条件、选择操作、交叉操作、变异操作等关键步骤,并对遗传算子应用启发式剪枝策略,最大化搜索的空间和时间消耗,最终获得最高的投资回报。 比投资组合参数。
为了测试这个模型,猜思科技从2012年到2018年对2万场足球比赛进行了模拟训练,并在测试集中的300场比赛上进行了测试,回报率为41%。
在足球领域,这样的回报率已经非常不错了。
背后的团队
最后介绍一下这个模型的核心打造团队——猜思科技。 CEO谢波、CTO郭阳,以及包括首席科学家在内的神经网络团队均来自“西二旗”,曾任百度核心业务部成员。 技术和产品骨干。
CTO郭阳透露,建立这个预测模型只是基于现有条件的一个小测试。 他希望为Go创建一个类似的培训和教学工具。 最终目标是帮助国内彩票玩家提高游戏分析能力和投注技巧。
但它只是一个机器辅助决策应用程序。 在更广泛的场景中,我们希望将能力应用到更多有趣的领域,比如电子竞技、创造101选秀投注、加密货币价格趋势……
- 超过-