何首乌

注册

 

发新话题 回复该主题

硬核投稿数据能告诉你的,远比希金斯 [复制链接]

1#

本期推送,来自于大学生斯诺克球迷「死如秋叶」的投稿,内容取材于于他的统计学作业。有关“谁是史上最强斯诺克”选手的争论,似乎永远不会有尽头以及正确答案,但是科学的统计方法,至少可以提供一个更加客观的视角......全文较长,如果阅读论证过程较为困难,建议直接下滑至文章最后的段落“4、总结与展望”。

摘要

在各种体育运动中,都有伴随大量比赛产生的大量数据。随着技术的不断发展,在体育运动中还将有更多种类和数量的数据被记录。虽然数据量巨大,但如何利用这些数据一直缺乏全面、可靠的研究。本文建立了一个包含88位斯诺克球员的生涯数据库,并采用一些多元统计方法对他们的能力、成就等方面进行综合分析。

1、引言

在任何一项职业体育中,对运动员进行比较都是一个永不过时的话题。在斯诺克运动中,也不例外。我们在对球员进行比较时,常常会用到一些数据,但往往都是一元的简单排序。对于斯诺克比赛中浩如烟海的数据来说,仅仅得到如此简单的结论,显然没有发挥出它的全部潜力。之前「台球不闹腾」曾推送过一篇利用了年以来职业比赛结果数据进行复杂网络分析的文章,但其分析结果是约翰·希金斯是表现最佳的球员,这显然无法得到大部分球迷和专家的认可。下面的“文献综述”部分将有助于读者理解为何复杂网络分析被用于职业体育相关的分析,以及为何它得到的结果存在较大偏差。

文献综述

用数据方法研究职业体育的尝试并不罕见,但是数量也并不多。这可能与数据的有限和缺失有关。以斯诺克运动为例,在年以前,即使是职业巡回赛中,也有大量的资格赛比赛没有详细的得分等数据。而现在职业巡回赛中的所有比赛都有详细的精确到每一杆的时间以及对应结果的记录,并且有全程录像。此外,在电视台转播的比赛中,为了更好地解读比赛,通常都有详细的技术指标数据,例如进球成功率、防守成功率、长台成功率等。但这些数据不可能在每一场比赛中提取,因为需要对录像进行人工分析,工作量太大。

在现有的关于职业运动的研究中,复杂网络(

分享 转发
TOP
发新话题 回复该主题