金州勇士队夺冠机率的数据分析案例
2021-01-08 08:48:47 阅读(186) 评论(0)
摘要:金州勇士队在去年的NBA常规赛和决赛中赢得了双重冠军,但许多人认为他们的成功主要是因为运气好,他们的小球战术只适用于常规赛。在StitchFix算法团队中,有很多勇士的忠实粉丝,所以我们计划从数据科学的角度探索勇士夺冠的决定性因素。在我们的分析结果中有两个主要的发现,这也是本文想讨论的主要内容:金州勇士队去年的成功不是偶然的,而是基于他们多样化、高效的阵容和足够聪明的教练团队(马刺制作,这是一个高质量的产品)。如果凯文·乐福和凯里·欧文在总决赛中保持健康,金州勇士队仍然会赢得最后的胜利——尽管他们可能会遇到非常激烈的七场系列赛决斗。方法-高级视图本文中使用的基本模型如下:如果我们能建立一个预测模型,忽略最近的输赢势头,如果模型预测金州勇士队将成为去年最好的球队,我们可以认为勇士队的成功不是偶然的。为了更好地建模,我们需要了解球员原型对球队赢得给定比赛概率的影响。我们专门建模和探讨上场时间的分配(取决于球队的阵容和教练的决定)将如何影响球队赢得比赛的能力。换句话说,这种方法专注于探索团队DNA的重要性,而不是比赛现场的一些临时因素。因此,我们主要探讨金州勇士队在2015赛季是否拥有最佳球队DNA。第一步:构建球员原型。我们用k-means聚类法分析2011-2012-2012-2013赛季的球员数据,得到相应的球员原型(聚类结果)。原型是根据球员的统计数据获得聚类结果的中心,我们可以将下赛季的任何球员映射到相应的原型中。需要注意的是,原型基本上是球员在场上表现的简化视图。利用原型建模有利于提高模型的稳定性(考虑更大的样本数量,而不仅仅是个别球员),因此我们可以在一定程度上避免超级明星的影响(这违反了我们基本模型的假设条件)。第二步:预测比赛结果,在第一步使用k-means算法构建球员原型后,我们将估计每种类型原型的重要性。对于2014-2015赛季的任何给定比赛:根据比赛前90个比赛日内所有比赛的统计数据,建立球员原型。计算双方球队之间各原型上场时间的差值变量,然后利用这些数据构建回归模型来预测胜者。本质上,这意味着模型的预测结果是基于球队合理分配球员上场时间的能力。需要注意的是,该模型不知道球队在每个时间点的表现以及球员之间的相互作用,因为该模型使用绩效表数据进行建模。换句话说,该模型忽略了比赛现场的一些临时因素。另外,这个模型主要是利用教练分配给每个球员原型的上场时间,这意味着我们有效地考虑了球员受伤的情况。同时,上场时间的分配差异也能体现教练的执教水平。第三步:比较实际数据对比模型的预测结果和实际比赛结果。这一步是分析的难点。如上所述,我们的观点是基于一个先决条件——如果这个简单的模型真正反映了现实,那么我们可以认为成功不是因为运气和一些神奇的协同效应。正如刚才提到的,我们利用2011-2013赛季的成绩表数据构建k-means模型,获得球员原型的结果。以下是我们模型中使用的一些球员数据:助攻、进攻和防守篮板、失误、抢断、得分、上场时间、三分球投篮次数、投篮命中率、罚球次数、罚球命中率、盖帽、上场时间比例和效率值(NBA计算的EFF值)。我们的目的是获得80-90%的解释模型。我们从场均8分钟以上的球员中选择50个原型,另一个原型是场均8分钟以下的球员,分为51个原型。请注意,每个赛季大约有400-450名球员上场时间超过8分钟。请注意,每个赛季大约有400-450名球员上场时间超过8分钟。原型是真实球员的简化视图——他们是k-means聚类的各类中心。为了更好地理解聚类结果,我们创建了一张热图,并绘制了2014-2015赛季最活跃的25个原型(根据上场时间)。图中右侧坐标轴的标签代表每个分类中最具代表性的球员,热图中的数值代表各种中心的数值。为了预测比赛结果,我们将利用各种原型的上场时间来预测一支球队赢得比赛的可能性,并估计各种原型的重要性。我们将讨论这个内容分为三个部分:模型中的预测变量模型估计验证方法和结果预测变量步骤2中的回归模型主要基于一个简单的想法:赢得比赛的概率可以通过分配给不同类型球员的比赛时间来预测。因此,对于每支球队,我们构建以下变量:从这些变量中,我们计算出两支球队之间的差异。在给定的比赛中,我们通过以下公式构建“差值变量”:模型估计本文构建的logistic回归模型如下:其中H表示共同的主场指标,而不是特定球队的指标。模型的解释系数将根据比赛前90天的数据进行更新和迭代估计。同时,我们使用L1正则化方法(lasso)选择重要的变量,降低模型过度拟合的可能性。因此,我们的目标可以被视为解决优化问题:L(·)表示标准logistic回归模型的对数似乎估计了函数值的相反数,lambda表示模型的惩罚系数。我们可以用R中的glmnet包来解决这个问题,通过交叉验证法来确定惩罚系数的最佳估计值。如上所述,我们使用每场比赛前90个比赛日的数据来重新估计模型的系数(不包括非比赛日)。以下是我们这样处理的原因:使用一个给定的球员原型来估计整个赛季的结果会有一定的偏见。我们希望建立的模型能够适应调整。赛季初,主要利用上赛季的数据进行建模。但随着比赛的进行,建模数据完全基于本赛季的历史数据。通过动态调整模型,使用相当多的球员原型,我们可以将一些潜在趋势纳入模型(这不是我们基本模型的一部分)。然而,这些影响是无法量化的,我们决定将其纳入模型。模型验证球队1获胜的概率是:其中,当p大于0.5时,我们认为球队1将获胜。需要注意的是,许多变量系数在给定90天窗口的前提下被压缩到0(即L1正则化模型被删除)。该模型使用一天的预测来验证该模型的准确性,这意味着该模型使用前90个比赛日的历史数据来预测下一天的结果。利用这个验证方案,我们可以得出结论,上半赛季的预测精度是61%,下半赛季(包括季后赛)的预测精度是66%。ROC曲线下的面积分别为0.68和0.71。一般来说,该模型可以在保持简化的基础上保持一定的准确性,随着时间的推移,该模型的准确性也会提高。常规赛预测准确率为81%,季后赛预测准确率为76%。事实上,该模型倾向于更好地预测一些“极端”球队。比如这个模型成功预测了洛杉矶湖人75%的比赛——上赛季湖人球员DNA水平比较低;对于圣安东尼奥马刺来说,预测精度只有60%。该模型可以更好地预测每支球队的排名,其中该排名是由模型预测的胜率排名获得的。在下一章中,我们将更详细地介绍此内容。对比现实数据,下一步就是我们开始测试模型的假设条件。正如上述基本模型所提到的,如果“傻瓜”模型的预测结果与上赛季非常相似,我们可以认为金州勇士队的成功并非偶然。该模型预测金州勇士确实是上赛季最好的球队(使用一期预测模型)。事实上,这个模型预测勇士队将取得78胜4负的战绩!此外,该模型预测金州勇士队将赢得四轮季后赛。因此,我们可以得出结论:金州勇士队的成功不是因为运气好,而是因为他们拥有最好的DNA球队。下表显示了2014-2015赛季各队的真实胜率和模型预测胜率。该表还显示了预测排名和排名误差。负排名误差意味着该模型认为该团队应该赢得更多的比赛(如波特兰开拓者),而正排名误差意味着该团队的表现超出了该模型的预期结果(如圣安东尼奥马刺)。接下来,让我们来看看该模型对季后赛的预测。从下表可以看出,该模型对对休斯顿火箭队和克利夫兰骑士队的系列赛有点乐观。对休斯顿火箭来说,这个模型预测勇士会横扫对手,而对骑士来说,这个模型认为勇士只会输掉一场比赛。休斯顿火箭队在原文中被描述为孟菲斯灰熊队。那么,为什么金州勇士队是一支好球队呢?上述回归模型和原型分析证实了两件事:斯蒂芬·库里是球队的领导者,勇士队的上场时间分配非常合理。库里是模型系数中最重要的原型变量。此外,库里是2014-2015赛季唯一一个从头到尾满足原型的球员。换句话说,库里一直在有效地帮助球队取得胜利。相比之下,我们发现开拓者的利拉德只有30%的时间来满足库里的原型变量。金州勇士也可以很好地将时间分配给其他几种重要原型的球员。这意味着金州勇士队的阵容非常强大(也就是说,他们有更好的DNA),他们的教练知道如何有效地将时间分配给这些球员。下图生动地展示了上述情况:图中条形图的宽度代表了原型变量的重要性,而长度代表了分配给这类玩家的剩余时间(即logistic模型中的DJ)。从下图中,我们发现森林狼将大部分时间分配给表现不佳的原型球员,这也解释了他们去年只赢了20%的比赛。波士顿凯尔特人队在左下角。如果凯文·勒夫和凯里·欧文没有受伤,比赛将解释说,如果凯文·勒夫和凯里·欧文保持健康,骑士队将赢得最后的胜利。因此,我们认为这个问题值得建模分析。以下是我们的处理过程:确定上赛季金州勇士队和克利夫兰骑士队的所有核心球队都保持健康。这场比赛于2015年2月26日在克利夫兰举行。尽管模型预测金州勇士队将赢得比赛,但克利夫兰骑士队最终还是赢了。这场比赛为这些球员提供了保持健康的上场时间分配值。移动到季后赛,并将数据替换到模型中。回想起来,这个模型是一个自适应更新的模型,球员们已经被映射到不同的原型中。因此,2015年2月的预测结果将与2015年6月的预测结果不同。这一分析结果描绘了一个有趣而可信的故事:后验预测模型预测骑士队在克利夫兰获胜的概率为54%,而勇士队在主场获胜的概率为53%。基于这一预测数据,金州勇士队将以微弱的优势赢得最后的胜利。换句话说,如果凯文·勒夫和凯里·欧文保持健康,这将是一场激烈的七场系列赛,金州勇士队将以主场优势赢得冠军。虽然这是一场五五开的比赛,但我们必须选择胜者!如果我们打算用这个模型来预测未来的比赛,而不是作为后验预测模型来测试假设条件,那么我们必须假设每个球员的上场时间,然后映射到各种原型中。这将导致一个有趣的假设场景——教练可以在赛前制定时间分配计划,就像企业每季度和年度实施计划一样。当然,没有准确的说法来证明金州勇士队的成功来自运气或他们的球队基因。我们的方法只是提供了一个新的视角,其他数据分析团队可能会得到完全不同的答案。没有人知道绝对正确的答案。然而,基于我们的分析结果和本赛季(2015年)–2016赛季)15-0梦幻般的开局,包括两次击败洛杉矶快船队——主教练里夫斯是“运气论”的支持者。我们觉得金州勇士队正在复制上赛季的成功之旅。
推荐阅读
- 好用的免费的人事管理系统软件大盘点!
纵观世界风云,中国依然屹立在世界民族之林!这几年中国的发展日新月异,这个成果离不开国内企业的努力,再加上互联网的发展,如果有好用的免费的人事管理系统软件,那我们讲事半功倍,这里为大家推荐几款! 1.HYDG人事管理系统软件 它适用于企事业单…查看详情
- 英语学习软件 英语学习app推荐
现在市面上学习英语的软件app五花八门,很多人都选不到一款适合自己的app。下面万商云集小编给大家介绍下英语学习软件 英语学习app推荐这方面的内容。英语学习软件 1、Voscreen——英语学习软件界的“抖音” 想要提升听力水平却又听…查看详情
- 电商平台代运营要有6个规划,才叫专业,才能选择它
社会发展、互联网发展,迎来的是人们生活方式的改变,企业经营模式的改变。个人在开网店、商家在开网店、企业在开网店,网店数量一直在增加,与此同时电商平台代运营公司也在急速增加。 图片来源于网络 电商平台代运营公司的出现,是为了帮助开网店的个人、…查看详情
- 推荐几款好用的手机语音播报器,让生活更简单
经常面对手机,对于眼睛也是会有伤害的,或者是因为工作太忙,难免就会错过其中的一些重要消息。建议大家可以使用手机语音播报器,这样能够减少对对于眼睛的伤害,同时也可以,大家更快的掌握到手机里面的内容。那么下面就大家推荐几款好用的手机…查看详情
- 可信网站认证有用吗?是噱头还是真的重要!
在“互联网+”这样的革命时代,人们生活在当下在这股不可抗拒的潮流之中。人们在享受互联网带来的方便高效之余,网络骗术的“应运而生”为“真相”蒙上了面纱,网络骗子层出不穷,网络诈骗手段千变万化,身边的受害者越来越多,虽不致人人自危的地步,但用户…查看详情
- 小说阅读软件哪个好免费 哪个小说app最好用
小说是我们每个人都比较喜欢看的东西,里面的文字可以在脑海中形成一种画面,这种画面就是小说的文字场景所展现出来的东西,在休闲或者是无聊的时候可以非常有效的打发时间,那今天我们就来盘点一下小说阅读软件都有哪些。 1、完本小说阅…查看详情
- 超市电商系统丨建立中小型商超线上竞争优势的有效工具
万物互联的说法以及线上业态的逐渐完善,让众多线下企业疾步追赶线上发展的步伐。对于商超企业来说,大型商超常见的就是增加超市电商系统,结合线下销售量和给厂家回款的优势,经过电商授权,走传统企业数字化转型模式,开启线上销售渠道,低价走量,是完全可…查看详情
- 这些云财务软件工具,你都知道吗?
随着互联网技术的发展和应用软件的成熟 ,云财务软件市场也发展的如火如荼。但作为新起行业,无论是巨头还是新公司为了抓住众多企业的需求,都纷纷加入云财务软件这片红海中,导致各式各样的云财务软件工具都有,让众多企业无处下手,既怕花了冤枉钱,又怕对…查看详情
- 从美退市,再赴港上市,国产奶粉品牌飞鹤好样的!
今日获悉,国产奶粉品牌“飞鹤乳业”通过了港交所主板IPO上市聆讯,即将上市!事实上,这并不是飞鹤乳业第一次上市。早在2003年5月,飞鹤乳业就登陆美国纳斯达克成功上市,是中国第一家在境外上市的乳品企业。然而2013年7月,飞鹤乳业选择从美退…查看详情
- 2022销售用什么软件找客户
找企业客户最核心的需求是找到企业的关键联系人,一般来说是企业决策者或法人,这样的沟通才最直接有效。下面万商云集小编给大家来介绍一下2022销售用什么软件找客户这方面的内容。 一、工商数据 任何一家正规企业在注册登记之前,都需要到工商局…查看详情
- 网站建设前提:如果不确定五件事,网站做得再好也不会有效果
转线上、建网站、引用户、促销售、获收益,其实并不简单,也不是企业随便建好一个网站,就能产生效果的。网站建设前提是确定5件事,搭建好的网站才能产生企业想要的效果。 图片来源于网络 ● 网站建设前提一:根据网站业务确定功能需求 了解企业的业务…查看详情
- 涉外专利权转让需要哪些条件?
对于涉外专利权转让需要哪些条件,相信有很多人都还不够了解,你知道在我国,相关法律对此是怎么规定的吗?万商云集小编为大家收集整理了一些相关内容,赶紧一起来看看吧!希望以下的内容能够为你提供帮助。 涉外专利权转让需要哪些条件? 《中华人…查看详情
- 网上订票用什么软件好 手机订票app推荐
春运期间,当我们在工作、在学校时不方便到车站购买回家车票,我们可以在网上买票,节省我们了很多的时间。下面是我给大家盘点的6款拥有网上订票系统的软件,有需要的小伙伴们可以看一看。 1.铁路12306 它是中国铁路总公司官方推…查看详情
- 什么是合约机手机
手机合约机和非合约机有什么区别吗?合约机与非合约机区别:合约机是定制机被植入运营商应用软件不可删除。非合约机是非定制机没有植入运营商应用软件。 合约机一般机后壳或开机都有运营商LOGO在协议期内不能销户或停机保号或过户。 定制机不一定就…查看详情
- 开发小程序费用多少呢
开发一款小程序需要多少费用? 小程序开发是肯定要收费的,开发的费用主要包含以下4个部分 1、认证服务费300元,如果不需要使用微信支付等需要认证才能实现的功能,此项可以不认证,及免收费。如果你有已经通过微信认证的公众号,那可以通过公…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP

企业首选的数字选用平台






