重庆大学研究生数理统计大作业.doc
- 文档编号:84200
- 上传时间:2022-10-02
- 格式:DOC
- 页数:11
- 大小:569KB
重庆大学研究生数理统计大作业.doc
《重庆大学研究生数理统计大作业.doc》由会员分享,可在线阅读,更多相关《重庆大学研究生数理统计大作业.doc(11页珍藏版)》请在冰豆网上搜索。
数理统计
NBA球员科比单场总得分与上场时间的线性回归分析
摘要
篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。
本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。
正文
一、问题描述
随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。
本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。
篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:
情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。
倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。
因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。
二、数据描述
抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
上场时间(分钟)
45
48
41
47
43
47
48
36
38
42
38
12
38
36
得分(分)
34
47
30
25
24
23
19
30
31
36
21
0
31
11
编号
15
16
17
18
19
20
21
22
23
24
25
26
27
28
上场时间(分钟)
40
44
42
39
39
32
39
38
36
33
28
39
36
37
得分(分)
19
41
42
30
34
33
29
38
40
16
9
20
4
28
编号
29
30
31
32
33
34
35
36
37
38
39
40
41
42
上场时间(分钟)
38
30
37
37
39
39
34
39
35
39
42
43
43
37
得分
20
27
21
18
17
17
14
21
14
29
16
26
22
31
编号
43
44
45
46
47
48
49
50
51
52
53
54
55
56
上场时间(分钟)
28
35
39
41
42
44
42
31
44
44
44
43
40
44
得分(分)
23
28
27
20
29
38
36
27
40
34
34
30
34
30
编号
57
58
59
60
61
62
63
64
65
66
67
68
69
70
上场时间(分钟)
44
41
43
44
34
35
39
37
44
33
37
39
39
35
得分(分)
31
42
34
35
29
39
34
14
40
19
30
38
25
22
编号
71
72
73
74
75
76
77
78
79
80
81
82
83
84
上场时间(分钟)
38
38
34
33
37
32
43
38
35
33
28
29
25
19
得分(分)
31
28
20
27
29
15
40
30
22
21
22
31
18
10
表2.12012-2013赛季球员科比布莱恩特的上场时间与得分记录
以上数据由腾讯篮球中心提供,特此说明。
三、模型建立
(1)假设条件
假定球员每场的发挥均为独立同分布事件,
(2)模型构建
以上场时间为自变量Xi,单场得分为应变量Yi,建立正态线性模型式:
其中β0、β1为模型参数。
(3)模型求解
由数据记录资料:
用最小二乘法求得
回归方程:
,其中
若x0表示x某个固定的值,则相应的
由于与是由历史数据得出,
因此相互独立。
容易证得:
,
同时可推出服从正态分布,并能求得:
,
即:
,
由于与均相互独立,故与
相互独立,又
故有:
。
因此,给定一个X0,再给出一个置信水平1-α,就可以求出相对应Y0的预测区间:
当样本n比较大时,由于,
于是Y的置信水平为1-α的预测区间近似为:
四、计算机设计方法与实现
(1)回归方程求解
数据如表2.1所示,事先去掉因伤病导致的缺席的数据点,经过观察分析,数据近似服从线性分布,求解的详细过程见附表1,
由数据计算得:
根据最小二乘法原理得:
回归方程为:
样本点与回归直线的关系如图4.1所示:
图4.1
(2)显著性检验
提出统计假设:
H0:
,H1:
采用r检验法:
取显著水平,
则有,因此拒绝原假设,接收科比布莱恩特2012-2013赛季单场总得分与上场时间存在显著的线性关系。
(3)区间预测
以Yo的区间预测为例:
由以上计算同时可求出:
由于:
Yo的置信度为1-α的置信区间为:
由t分布表,我们可以预测球员科比布莱恩特在相应的上场时间Xi里其单场得分Yi的置信度为1-α的置信区间。
例:
当Xi=40,置信水平1-α=1-0.05=0.95时:
查表:
由线性内插法得到
计算得:
因此当Xi=40时,参数Yi置信度为0.95的置信区间为:
即当球员科比布莱恩特上场时间为40分钟时,其单场总得分落在区间的概率为95%。
五、模型结果分析
基于以上的结果可知,对于湖人队球员科比布莱恩特,其单场总得分与其上场时间有显著的线性关系,可以认为能通过改变其上场时间从而以线性的关系改变其单场总得分。
六、结语
以上方法得出的结果与真实值相比有一定偏差,但由于样本数量较大,因此数据结果也有较大的可信度,当样本数量增加时,用来预测的数据也更多,这样预测的可靠性会增强。
通过以上将所学知识应用于实践的过程,更好的让我理解了学以致用的学习过程,只要我们留心观察,数学模型则无处不在。
理论联系实际,学以致用,才是我们学习这门课程的最终目的。
参考资料:
[1]杨虎,刘琼荪,钟波.应用数理统计.北京:
高等教育出版社.2004
附录
原始数据(来自腾讯篮球数据中心):
比赛
首发
时间
投篮
3分
罚球
后篮板
前篮板
总篮板
助攻
抢断
盖帽
失误
犯规
得分
82-103 马刺
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
89-120 马刺
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
91-102 马刺
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
79-91 马刺
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
99-95 火箭
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
91-86 马刺
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
118-116 勇士
是
45
9月21日
4月8日
12月16日
5
0
5
4
0
0
5
3
34
113-106 开拓者
是
48
14-27
1月5日
18-18
8
0
8
5
3
4
1
4
47
104-96 黄蜂
是
41
9月18日
2月7日
10月11日
5
1
6
6
5
1
5
2
30
95-109 快船
是
47
6月19日
1月5日
12月14日
6
1
7
10
0
0
4
3
25
86-84 灰熊
是
43
10月23日
0-5
4月4日
5
0
5
9
1
0
4
3
24
101-81 小牛
是
47
8月18日
0-3
7月8日
10
1
11
11
4
2
4
3
23
103-98 国王
是
48
5月18日
0-4
9月11日
8
1
9
14
2
0
1
2
19
103-113 雄鹿
是
36
6月17日
0-3
18-20
2
0
2
3
0
0
6
2
30
120-117 森林狼
是
38
12月21日
3月7日
4月6日
3
0
3
7
1
1
6
4
31
103-109 勇士
是
42
11月27日
2月10日
12月16日
7
1
8
3
0
0
0
1
36
100-103 奇才
是
38
8月18日
1月2日
4月7日
3
1
4
11
2
0
6
3
21
76-99 太阳
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
113-102 国王
否
0
0-0
0-0
0-0
0
0
0
0
0
0
0
0
0
99-93 步行者
是
12
0-4
0-1
0-0
1
0
1
2
0
0
1
1
0
92-96 老鹰
是
38
11-33
2月8日
7月8日
6
1
7
5
2
0
5
1
31
106-97 魔术
是
36
4月14日
2月6日
1月2日
6
1
7
8
2
0
3
1
11
90-81 公牛
是
40
7月16日
1月4日
4月6日
6
1
7
9
2
0
2
2
19
118-116 猛龙
是
44
11月22日
5月10日
14-16
5
1
6
12
2
0
9
0
41
108-102 黄蜂
是
42
14-21
3月7日
11月14日
7
0
7
12
0
1
6
0
42
105-122 雷霆
是
39
8月19日
3月7日
11月12日
2
1
3
2
0
0
2
3
30
99-98 老鹰
是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 重庆 大学研究生 数理统计 作业