大学专业与数学成绩的研究数模doc.docx
- 文档编号:29484658
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:19
- 大小:214.29KB
大学专业与数学成绩的研究数模doc.docx
《大学专业与数学成绩的研究数模doc.docx》由会员分享,可在线阅读,更多相关《大学专业与数学成绩的研究数模doc.docx(19页珍藏版)》请在冰豆网上搜索。
大学专业与数学成绩的研究数模doc
大学专业与数学成绩的研究
摘要
本文先使用excel软件对数据进行基本的预处理,对问题一、二,使用spss统计软件对数据进行T检验,得出A、B专业在高数上册、高数下册、线代、概率成绩的总体均值都有明显差别的结果;则针对每门课程分析,两个专业学生的分数有明显差异;针对专业分析,两个专业学生的数学水平有明显差异。
对问题三,使用spss统计软件对数据进行简单相关性检验及回归性分析,得出高数上下册平均值与线代、概率有一定的相关性,但相关性一般。
而高数上下册平均值与线代、概率的线性回归拟合优度都较低。
则高等数学成绩的优劣,影响线性代数、概率论与数理统计的得分情况,但影响程度不算太大。
根据上述分析,总结得出大学数学课程学习的建议要点:
①注重基础的学习,②编制数学的知识网络,③理论知识理解,④学会公式、定理的实践应用。
关键词:
spss软件显著性检验相关性检验回归性分析
1、问题的重述
1、背景分析
基本每个大学生都要学习公共数学的相关课程,但是数学水平是否跟专业有关呢?
各门数学课程的成绩是否跟专业有关呢?
2、有关情况
题目已知某高校A专业和B专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计三门公共数学课程的期末考试成绩数据表格。
3、问题提出
(1)针对每门课程分析,两个专业学生的分数是否有明显差异?
(2)针对专业分析,两个专业学生的数学水平有无明显差异?
(3)通过数据分析说明:
高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?
(4)根据你所作出的以上分析,阐述你对于大学数学课程学习方面的看法。
2、问题的分析
本题是研究不同专业、不同数学课程差异性分析的问题,对问题一解答在总体上应沿着这样的思维路线:
对已知数据的预处理、分析各数据之间的差异性、分析各因素之间的相关性、评价与建议。
因为已知数据中有一名学生四门数学课程的成绩均为0,为保证数据的代表性,本文将删去该学生的所有成绩再进行分析。
计算A、B专业学生的高数上册、高数下册、线代、概率的最小值时忽略所有0值,找出“第二最小值”。
问题一、二中,我们先用excel软件对数据进行预处理,然后用spss软件对其进行T检验,分析其差异性。
问题三中,我们用spss软件先对数据进行简单相关分析,判断其相关性,再进行线性回归分析,建立拟合模型。
问题四中,我们要根据对问题一、二、三的研究结果来分析得出大学数学课程的学习方法,重点在根据分析得出建议与看法。
这有数据得出的结论建议对于大学生学生学习数学有很大的用处。
3、模型的假设
1)假设所给出的数据及找到的数据是正确的。
2)假设四门数学课程成绩均为0的学生是因为特殊原因而没有参加期末考试,故删去该学生的所有成绩。
3)计算A、B专业学生的高数上册、高数下册、线代、概率的最小值时忽略所有0值,找出“第二最小值”。
4)假设成绩90-100分为优秀,成绩70-80分(不含80)为良好,成绩60-70分(不含70)为合格,成绩0-60分(不含60)为不合格。
4、模型的建立与求解
(一)问题一
1.1模型一的准备:
问题一中,我们先用excel软件和spss软件分别计算出A、B专业学生的高数上册、高数下册、线代、概率成绩的相关值(平均值、标准差、最大值、最小值、中位数、总数),如下表
表一
A专业学生数学成绩的相关值
高数上册
高数下册
线代
概率
平均值
69.98
66.04
70.85
75.15
标准差
12.18
12.91
11.31
12.17
最大值
99
97
100
97
最小值
43
37
41
35
中位数
66
65
69
75
众数
60
64
60
60
表二
B专业学生数学成绩的相关值
高数上册
高数下册
线代
概率
平均值
71.33
70.12
70.68
75.09
标准差
15.23
10.23
14.61
14.04
最大值
95
96
98
97
最小值
37
40
39
22
中位数
72
67
72
76
众数
60
60
60
90
由表一、表二可大略知道:
A、B专业学生数学成绩的相关值比较
高数上册
高数下册
线代
概率
平均值
B>A
B>A
A>B
A>B
标准差
B>A
A>B
B>A
B>A
最大值
A>B
A>B
A>B
A=B
最小值
A>B
B>A
A>B
A>B
中位数
B>A
B>A
A>B
B>A
众数
A=B
A>B
A=B
B>A
1根据平均值:
B专业学生的高数上、下册的成绩较A专业的高,A专业的线代、概率的成绩较B的高。
2根据标准差:
A专业学生的高数上册、线代成绩的标准差较小,说明A专业学生的高数上册、线代成绩比B专业的集中、离散程度小。
而B专业学生的高数下册的成绩标准差较小,说明B专业学生的高数下册成绩比A专业的集中、离散程度小。
3根据最大值、最小值:
A专业学生各门数学课程的最高成绩都比B专业的高(或相等),除高数下册的成绩,A专业的学生的各门数学成绩最小值都比B专业的高。
1.2模型一的建模基本思路:
先判断A、B专业学生各门数学课程的成绩是否符合正态分布,若符合正态分布,则对两组数据进行独立T检验,根据T检验的结果来分析其差异性。
1.3模型一的建立:
首先,判断是否符合正态分布。
用spss软件分别绘出A、B专业学生各门数学课程的成绩直方图及正态曲线(如下图)。
由下图可知,A、B专业学生各门数学课程的成绩均符合正态分布。
然后,对两组数据进行T检验。
用spss软件对A、B专业学生各门数学课程的成绩进行均值独立样本T检验。
结果如下图。
由下图可知,对于高数上册,在原假设方差相等(齐性)下,F=1.143,Sig.=0.286>0.05(其P值大于显著性水平),说明接受两个总体方差是相等的假设,可进行两独立样本T检验 。
因此A、B专业在高等数学上册成绩的总体均值有明显的差别,其95%的区间估计为[-4.835,2.144]。
同理可知,A、B专业在高数下册、线代、概率成绩的总体均值有明显的差别。
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
差分的95%置信区间
下限
上限
高数上册
假设方差相等
1.143
.286
-.759
258
.448
-1.345
1.772
-4.835
2.144
假设方差不相等
-.790
253.320
.430
-1.345
1.704
-4.701
2.010
高数下册
假设方差相等
.012
.912
-2.844
258
.005
-4.087
1.437
-6.917
-1.257
假设方差不相等
-2.730
193.484
.007
-4.087
1.497
-7.039
-1.135
线代
假设方差相等
1.346
.247
.101
258
.919
.171
1.683
-3.144
3.485
假设方差不相等
.106
255.321
.916
.171
1.610
-2.999
3.341
概率
假设方差相等
1.562
.212
.035
258
.972
.058
1.677
-3.244
3.360
假设方差不相等
.035
246.347
.972
.058
1.635
-3.163
3.279
(二)问题二
将A、B专业学生各门数学课程成绩数据汇总,根据模型一的方法分析A、B专业学生的数学水平的差异性。
首先,用excel软件分别计算出A、B专业学生的数学成绩的相关值(平均值、标准差、最大值、最小值、中位数、总数)及分析,如下表
A、B专业数学成绩的相关值
A
B
比较
平均值
70.50
71.81
B>A
标准差
12.54
13.77
B>A
最大值
100
98
A>B
最小值
35
22
A>B
中位数
69
72
B>A
众数
60
60
A=B
1根据平均值:
B专业学生的数学成绩较A专业的高。
2根据标准差:
A专业学生的数学成绩的标准差较小,说明A专业学生的数学成绩比B专业的集中、离散程度小。
3根据最大值、最小值:
A专业学生数学成绩的最大值、最小值比B专业的最大值、最小值大。
其次,判断是否符合正态分布。
用spss软件分别绘出A、B专业学生数学成绩直方图及正态曲线(如下图)。
由下图可知,A、B专业学生数学课程的数学成绩均符合正态分布。
然后,对两组数据进行T检验。
用spss软件对A、B专业学生的数学成绩进行均值独立样本T检验。
结果如下图。
由下图可知,在原假设方差相等(齐性)下,F=1.143,Sig.=0.259>0.05(其P值大于显著性水平),说明接受两个总体方差是相等的假设,可进行两独立样本T检验 :
而Sig.(双侧)=0.448>0.05。
因此A、B专业在数学成绩的总体均值有明显的差别,其95%的区间估计为[-2.943,0.341]。
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
差分的95%置信区间
下限
上限
数学成绩
假设方差相等
1.274
.259
-1.555
1038
.120
-1.301
.837
-2.943
.341
假设方差不相等
-1.581
969.330
.114
-1.301
.823
-2.916
.314
(三)问题三
3.1模型二的准备:
将A、B专业学生各门数学课程成绩数据汇总,计算出每位学生高数上下册分数的平均值,以此代表高数成绩,并将高数成绩视为因变量,将线代、概率成绩视为自变量。
3.2模型二的建模基本思路:
先用spss软件对高数上下册平均值、线代、概率做简单相关分析,若有相关关系,则再用spss软件做回归分析。
3.3模型二的建立:
首先,做简单相关分析。
用spss软件分别对高数上下册平均值、线代、概率进行双变量相关分析。
结果如下图:
相关性
高数上下册平均值
线代
概率
高数上下册平均值
Pearson相关性
1
.499**
.439**
显著性(双侧)
.000
.000
N
260
260
260
线代
Pearson相关性
.499**
1
.487**
显著性(双侧)
.000
.000
N
260
260
260
概率
Pearson相关性
.439**
.487**
1
显著性(双侧)
.000
.000
N
260
260
260
**.在.01水平(双侧)上显著相关。
由表可知,高数上下册平均值与线代、概率2个指标的相关系数都在0.4以上,对应的p值都接近0,说明高数上下册平均值与线代、概率有一定的相关性,但相关性一般。
然后,做回归分析。
用spss软件对高数上下册平均值与线代进行线性回归。
得结果如下表
表一:
:
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.499a
.249
.246
11.574
a.预测变量:
(常量),高数上下册平均值。
b.因变量:
线代
表二
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
11463.985
1
11463.985
85.585
.000a
残差
34558.765
258
133.949
总计
46022.750
259
a.预测变量:
(常量),高数上下册平均值。
b.因变量:
线代
表三
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
26.479
4.839
5.472
.000
高数上下册平均值
.636
.069
.499
9.251
.000
a.因变量:
线代
表一给出了回归模型的拟和优度,由此可知,回归的可决系数和调整的可决系数分别为0.249和0.246,即线代的20以上的变动都可以被该模型所解释,拟和优度较低。
表二给出了回归模型的方差分析表,可以看到,F统计量为85.585,对应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
表三给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显著性t检验。
从表中可以看到无论是常数项还是解释变量x,其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t检验。
变量x的回归系数为0.636,即高数上下册平均成绩每增加1分,线代成绩就增加0.636分。
同理用spss软件对高数上下册平均值与概率进行线性回归。
结果如下:
表四
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.439a
.192
.189
11.958
a.预测变量:
(常量),高数上下册平均值。
b.因变量:
概率
表五
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8789.800
1
8789.800
61.469
.000a
残差
36892.738
258
142.995
总计
45682.538
259
a.预测变量:
(常量),高数上下册平均值。
b.因变量:
概率
表六
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
36.350
5.000
7.271
.000
高数上下册平均值
.557
.071
.439
7.840
.000
a.因变量:
概率
由上表可知,回归的可决系数和调整的可决系数分别为0.192和0.189,即概率的10以上的变动都可以被该模型所解释,拟和优度很低。
F统计量为61.469,对应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
无论是常数项还是解释变量x,其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t检验。
变量x的回归系数为0.557,即高数上下册平均成绩每增加1分,概率成绩就增加0.557分。
5、结果的分析与建议
(一)问题一
A、B专业在高数上册、高数下册、线代、概率成绩的总体均值都有明显的差别。
同时,根据成绩等级统计数据并绘图表:
A
高数上册
高数下册
线代
概率
优秀90-100
8.41%
2.80%
8.41%
9.35%
良好80-89
14.95%
9.35%
14.02%
35.51%
中等60-79
19.63%
18.69%
27.10%
20.56%
合格60-69
53.27%
59.81%
46.73%
31.78%
不合格0-59
3.74%
9.35%
3.74%
2.80%
B
高数上册
高数下册
线代
概率
优秀90-100
11.11%
3.27%
3.92%
16.99%
良好80-89
18.95%
18.30%
24.84%
25.49%
中等60-79
24.84%
24.18%
25.49%
22.22%
合格60-69
39.22%
50.98%
41.18%
29.41%
不合格0-59
5.88%
3.27%
4.58%
5.88%
A、B专业在高数上册、高数下册、线代、概率成绩的等级分布也有明显的差别。
所以,针对每门课程分析,两个专业学生的分数有明显差异。
(二)问题二
A、B专业在数学成绩的总体均值有明显的差别,同时,根据成绩等级统计数据并绘图表:
A、B专业在高数上册、高数下册、线代、概率成绩的等级分布有明显的差别,A专业在合格及以下的等级所占比例较多,而B专业在良好及以上的等级所占比例较多。
所以,针对专业分析,两个专业学生的数学水平有明显差异。
(三)问题三
由相关性分析知,高数上下册平均值与线代、概率有一定的相关性,但相关性一般。
由回归性分析知,高数上下册平均值与线代、概率的线性回归拟合优度都较低。
高等数学成绩的优劣,影响线性代数、概率论与数理统计的得分情况,但影响程度不算太大。
(四)问题四
根据上述的分析,高等数学成绩的优劣,影响线性代数、概率论与数理统计的得分情况。
所以大学生数学课程应注重基础的学习。
因为高等数学是数学学习的基础,“千里之行始于足下”,只有学好高等数学,打好数学的基础,才能更好地学习线性代数、概率论与数理统计的课程。
但是,并不是说学好了高等数学,线性代数、概率论与数理统计的成绩就一定好,因为知识是需要融会贯通的,尤其是灵活的数学知识。
所以,在打好数学基础的同时,我们更应该编制数学的知识网络,这样才能将书本读薄、读透。
而且,在理论知识理解后,我们还要学会公式、定理的实践应用。
坚持这样做下去,我们就基本能够学好大学的数学课程了。
6、模型的评价
(1)优点:
1本文大量地使用spss软件来整理数据及绘图,减少了计算工作量,大大降低了建模的难度。
2本文大量地使用图表来分析及显示结果,使分析更结果清晰明了。
3本文删去了四门数学课程成绩均为0的学生的所有成绩,增大了数据的代表性,使问题的分析更能反映真实情况。
4定义出5个阶段的成绩标准,比4个阶段的优良中差更全面,而且据此验证分析得出的结论,增加了结果的合理性。
(2)缺点:
1使用的数据、考虑的影响因素不够全面,造成一定的误差。
2分析数据差异性的方法较为单一,得出的结果不够全面。
7、参考文献
【1】姜启源等.数学模型(第四版)[M].高等教育出版社.2011.12(3)
【2】杜强,贾丽艳.SPSS统计分析从入门到精通[M].人民邮电出版社.2008,4
(1)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 专业 数学 成绩 研究 数模 doc