您的位置:首页 > 足球资讯

百度预测足球大数据(足球大数据:不仅仅是统计和分析之间的一步

  • 2023-06-23|
  • 作者:|
  • 来源:极速直播

编者按:与其他运动项目相比,足球运动的统计和分析开展得很晚,由于运动的特殊性,没有太多经验可供参考。 然而,随着大数据时代的到来,这种趋势越来越明显。 我们要做的不仅仅是收集数据,还要更好地分析数据来服务这项运动。 看到越来越多的先行者开始涌入足球数据分析领域,并取得了不错的成绩,但同志们还需要继续努力!

棒球分析领域有一个学派认为,如果没有这么多技术统计数据,比赛会更好。 之所以这么说,是因为他们声称目前的这些统计数据并不一定是真正反映棒球比赛的决定性数据,它们只是最容易统计的数据。 无论你是否同意,这确实是棒球分析的要害,而且仍然是争论的焦点。

这并不是说你是否相信这些数据,而是新的数据是否真的可以取代原来的统计结果。 即使是偶尔看棒球打发时间的人也往往会习惯旧的统计数据,部分原因是他们已经在棒球领域待了很长时间。 事实上,人们习惯了他们已经知道的统计数据,并且对学习新的数据分析结果持谨慎态度。

对于足球来说,过去的统计数据非常少。 事实上,如此流畅的比赛,如果不借助科技手段,是很难统计出传球次数等一些数据的。 人们在过去的十年里开始系统地记录一些关于游戏的统计数据,因为在这个时代,人们乐于收集和分析数据,同时也能从中受益。 像OPTA、Prozone这样专注于数据统计和分析的公司开始出现,他们的盈利模式就是把这些数据卖给俱乐部或者媒体(其实ESPN、SKY Sports等媒体的数据统计版块都是由OPTA)。

OPTA工作人员收集游戏数据

正如棒球或其他一些数据驱动的体育运动探索出更新、更先进的评价指标一样,人们现在也渴望在足球领域寻找一些新的统计指标,因为启发性的衡量指标必然是数据分析。 产品。 但这并不是一朝一夕就能实现的,因为数据统计公司在足球领域所做的数据收集工作只是在一百年前的棒球领域完成的。

现在,足球终于有了很多数据,下一步就是如何更好地利用这些数据。 与棒球等其他一些主流运动不同(这些运动领域的统计数据早已存在,数据分析最近才出现),足球领域目前的独特情况是数据统计与分析同时进行。

统计数据

让我们回到最初的问题,如果没有统计数据,棒球会更好吗? 这个问题对于足球统计至关重要。

近年来,诸如WhoScored、Squawka和FourFourTwo's Stats Zone(均由OPTA数据支持)等一批网站如雨后春笋般涌现,它们更好地向球迷展示了比赛的统计结果。 这些网站主要提供个人和球队的比赛统计数据,听起来有点像棒球的技术统计。 他们提供的信息可以让您知道哪个球员有一场比赛或一个赛季。 有热图和超车道等图形格式可以更好地呈现数据。

FourFourTwo 的 Stats Zone 软件中的玩家数据接口

但他们没有进一步提供如何使用这些数据进行游戏分析。 某后卫场均拦截率高对球队重要吗? 某个射手得分率低,真的意味着他是射手,以后就应该多传球吗? 还是只是因为他运气不好? 传球成功率 95% 的后卫是否比传球成功率 78% 的边锋更适合传中?

我们有数据,但我们无法解决这些问题,因为我们不知道哪些数据对于游戏分析真正重要。

这一幕让人回想起棒球统计革命刚刚开始的日子:如果你不知道这些统计数据到底有什么用处,为什么要引用这些统计数据呢? 这就是为什么我不明白为什么近50年来棒球直播中总是提到RBI(Run Battled in,棒球术语:RBI)这样无用的数据!

毫无疑问,使用数据对某些球员或球队的优秀程度做出无法证明的假设绝对是误导。 然而,这并不意味着数据不能被使用。

反对使用这些统计数据也意味着反对使用这些数据来描述比赛信息,以及球队和球员的表现。 尽管传统的棒球统计数据在分析和预测未来比赛方面效果不佳,但对于描述历史信息很有用。 尝试在没有任何统计数据的情况下讲述巴尔的摩金莺队过去一周的表现,或者解释一下克莱顿·克肖有多出色。

虽然原始统计数据无法解释为什么球员和球队表现得好或差,以及未来会怎样; 使用这些数字来描述球员和球队的表现是很直观的。

十年前,可能没有人知道哈维每场比赛传球次数以及成功率是多少。 如果没有这些信息,大多数人将无法了解哈维到底有多伟大,或者他的状态何时开始下滑。 同样,当你观看洋基队巨星德里克·杰特打球时,你只能说:“三年前,他的击球率非常高百度预测足球大数据,而今年他的数据却下降了。”

即使是最原始的统计数据也能让我们很好地了解游戏中发生的情况。 如果没有这一步的积累,我们就很难解释为什么会发生这些情况,或者接下来会发生什么。 这些原始统计数据是数据分析的基石,在美国体育界无处不在,但在足球界却是一个新概念。

数据分析

我们当然希望能够从这些简单的描述性统计数据背后挖掘出更多关于足球比赛本质的信息。 尽管该领域已经做了大量工作并取得了一些进展,但仍处于起步阶段。

射门比 (TSR) 是高级足球统计数据的鼻祖,由詹姆斯·格雷森 (James Grayson) 首次从冰球运动中引入足球。 这个指标设计的初衷很简单:强队一般射门次数较多,同时也会让对手很少有踢球的机会。

该统计数据的强大之处在于它具有良好的自相关性和更好的预测结果。 实证分析表明,球队过去的TSR可以预测球队未来的TSR,并且比球队过去的进球数和成绩更能预测未来比赛的进球数和成绩。

在赛季初预测排名的时候,TSR是一个很好的先行指标(虽然很多专家会抛开这个数据百度预测足球大数据,他们凭自己的直觉来预测最终的排名,这里有一个梗,这个指标预测的结果显示:曼联最终排名不可能进入前三,但所谓的搬砖,其实就是笔者自己认为曼联进了前三,我们只能在最后挖坟了。赛季~),当然,实际管理球队时可能并非如此。

但在冰球运动中,球队阵容可以随时调整,而且出手次数较高,这可以让我们详细分析球队表现最好时,哪位球员在场上。 足球比赛中,只有3次换人,射门次数也少得可怜,这使得TSR在球员层面的评价非常有限(至少到目前为止还没有好的结果)。

足球数据预测_百度预测足球大数据_大数据核心 预测 淘宝时光机

最近,预期进球(ExG)作为一项新指标出现。 从预测的角度来看,ExG 的表现结果与 TSR 相当(格雷森比较了这两个指标并给出了一些理论分析),但 ExG 的好处之一是它既可以预测球队表现,也可以预测个别球员的表现。 换句话说,您可以使用球员的进球总数,并根据他们的射门次数,您可以预测他们未来的进球数。

分解击球数据有点像从棒球中的击球平均值 (AVG) 分解击球平均值 (BABIP)。 事实证明,就像一个球员一般很难保持持续高或低的 BABIP 一样,一个球员也很难长时间保持高于或低于自己的 ExG 数据。 但必须再次指出,这些工作只是足球数据分析的初级阶段。

协调数据统计和分析

您可能已经注意到的一个问题是,目前许多分析工作都是通过镜头完成的,但这并不完全正确。 例如,Caley 提出的 ExG 模型考虑了导致射门的传球类型。 StatsBomb 的 Ted Knutson 创建了一种名为“球员雷达”的工具,通过添加球员上场时间和本方半场控球率等指标,可以更全面、更准确地了解球员统计数据

当然,值得注意的是,如何整合这些数据形成团队的数据是另一个大问题。 但目前来看,数据分析工作还没有包括对现有统计数据以矩阵形式进行分析。

造成这种情况的原因有很多,部分原因是公共领域的专家目前只投入少量时间来研究这些信息。 而且,即使你想做大量的分析,目前的统计数据可能只有五到十年的历史,不像棒球,有近一百年的大量数据,这让你无法得出更有效的结论。

很可能我们还没有收集到很多足球领域的重要数据。 同时,一些统计数据除了描述性之外可能没有其他分析价值。 关键是我们如何找到真正值得分析的数据。

毕竟我们需要统计数据来辅助分析,而分析的目的就是为了找到足球领域各种问题的答案。 但如果棒球界发生的事情有任何迹象的话,那么使用统计数据有可能既帮助我们真正发现有价值的信息,又会让我们误入错误的结论。

足球领域的统计数据太少,任何指标都需要综合,但足球统计数据落后棒球一百年的事实并不意味着足球不会有自己独特的评价指标。 而且足球领域确实有一点优势,那就是在棒球领域,基于统计数据的各种假设和猜测已经流行了一百年才受到数据分析的影响,而在足球领域,统计和数据分析去手牵手 。

【资讯关键词】: 数据 统计 足球 射门 传球

回顶部