北大心理统计习题.docx
- 文档编号:24369527
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:26
- 大小:34.80KB
北大心理统计习题.docx
《北大心理统计习题.docx》由会员分享,可在线阅读,更多相关《北大心理统计习题.docx(26页珍藏版)》请在冰豆网上搜索。
北大心理统计习题
心理统计习题集
习题1
1.用你参加过的一个研究例子,解释总体和样本的差别
在心理学概论的课堂最后,每位同学都得到了一张关于个人对前途看法的问卷。
该调查针对的是全体中国大学生的人生观,因此全体大学生是总体(pupation),而课堂上受到调查的同学是样本(sample)。
抽象成数学概念,总体是希望研究个体的全集,而样本是其依照一定规则选取的子集。
在该例子中,规则即选修心理学概论一课。
根据该规则,选修同学这一样本作为全集合的子集代表了全体同学。
2.一个研究者要验证大量的Vc能预防感冒。
他将被试分成两组。
一组每日给500mg的Vc,另一组给糖丸。
研究者记录了被试在3个月的冬季中患感冒的次数
1)因变量是什么?
答:
被试被试在3个月的冬季中患感冒的次数既是。
2)因变量的数据是属于哪一类量度?
答:
属于离散的比例等级(discretevariableinratioscale)量度。
3)这里用到什么研究方法?
答:
这里用到了实验研究法(experimentalmethod)。
3.一位研究者测量了两个个体的某种特征,得到不同的分数。
他得到结论说一个个体比另一个个体在这一特征上高两倍。
他用的量表是:
a)命名量表
b)顺序量表
c)等距量表
d)比例量表
答:
d。
习题2
1.一位研究者作大学生的智商研究。
他实验前先收集了如下一般资料:
a)学生的家庭收入状况:
低,中,高;b)学生的考入地区:
北方,中部,南方;
c)学生的专业;d)学生的GPA
学生
家庭收入
考入地区
专业
GPA
S1
低
北方
社会学
3.11
S2
中
中部
生理学
1.88
S3
高
中部
人类学
2.64
S4
低
中部
教育学
1.12
S5
中
北方
社会学
2.53
S6
高
南方
社会学
2.96
S7
中
北方
英语
3.16
S8
中
北方
工程
2.32
S9
中
中部
法语
1.96
S10
中
中部
化学
4.00
S11
低
南方
音乐
1.27
S12
低
中部
社会学
2.42
S13
中
南方
心理学
4.00
S14
中
北方
物理学
0.76
S15
中
中部
社会学
2.70
S16
高
北方
英语
2.10
S17
中
北方
社会学
3.83
S18
中
南方
社会学
0.09
S19
低
中部
心理学
2.65
S20
低
北方
人类学
2.17
S21
中
南方
生理学
2.73
S22
高
中部
心理学
0.13
S23
低
中部
社会学
1.58
S24
中
中部
经济学
3.68
S25
中
中部
物理学
3.25
1)该研究的样本量是多大?
答:
样本量为25。
2)对a)-d)的4个变量,其量度的类型是什么?
它们是离散的还是连续的?
答:
a是顺序等级量度,是离散量;b是命名等级量度,是离散量;c是命名等级量度,是离散量;d是比例等级量度,是连续量。
3)作出家庭收入状况,考入地区和专业的次数分布表
4)作GPA的分组次数分布表
2、研究者评价4种品牌的咖啡的味道,方法是让被试逐一品尝并对其做5点量表的评价(1——很糟糕,5——非常好)。
结果如下:
咖啡平均评价值
品牌A2.5
品牌B4.1
品牌C3.2
品牌D3.6
1)指出本研究中的自变量和因变量
2)本测量中的自变量是什么类型的数据(命名、顺序、等距、等比?
)
3)如果要用图来表示自变量和因变量的关系,应该用什么图(线图、直方图、棒图)?
4)用图表示本实验的结果。
3、研究者研究失眠者接受放松训练的次数对失眠治疗的效果。
有4个实验组,分别接受2,4,8次的训练,控制组不接受训练(0次)。
研究者测量被试入眠所需的时间,结果如下:
训练次数入睡所需时间(分钟)
172
258
431
814
1)判断本研究的自变量和因变量
2)自变量是什么数据类型(命名、顺序、等距、等比)?
3)如果要用图来表示自变量和因变量的关系,应该用什么图(线图、直方图、棒图)?
4)用图表示本实验的结果。
习题3
2、有一考试成绩分布,其平均数为71,中数79。
问这是一个正态分布,还是正偏态,负偏态?
3、对于下面的三种情况,请指出能最佳描述其“平均”值的集中量数(平均数、中数、众数)。
(1)样本为50个6岁儿童,关于他们最喜欢看的电视节目的研究。
(2)研究某饮食计划对病人的影响,记录6周后他们增加或减少的体重。
(3)一项关于动机的研究,要求被试在报纸中搜索单词“disicipline”。
研究者记录被试在找到单词或放弃前所用的时间(单位,分钟)。
样本n=20,平均数M=29分钟,中数17分钟,众数为15分钟。
4、对下面的数据
3,4,4,1,7,3,2,6,4,2,1,6,3,4,5,2,5,4,3,4
(1)画次数分布直方图
(2)指出这组数据的全距(提示:
你可以使用全距公式或者只要从直方图的X轴数一下即可。
)
(3)指出这组数据的四分位距和四分差。
5、一个样本n=25,样本方差s2=
100
(1)求样本标准差
(2)求样本和方SS
6、下列分数构成一个总体:
8,5,3,7,5,6,4,7,2,6
5,3,6,4,5,7,8,6,5,6
(1)绘制次数分布直方图
(2)在图中粗略估计分布的均值和标准差
(3)计算该总体的均值和标准差,与粗略估计的值
6‚计算下列样本分数SS,方差,和标准差:
431,432,435,432,436,431,434
习题4
1.有一次心理测验的成绩(成绩分布的总体为正态分布)μ=80,σ=8.此测验中,Tom得分X=84,Mary得分在第60个百分点上,John的得分换算成z分数是z=0.75。
将此三人的分数从高到低排序。
解:
z(tom)=(X-μ)/σ=0.5
z(john)=0.75
查表得0.2 故排序Mary 2.指出一个正态分布中位于下列z分数区间的概率: a)z=0.25——z=0.75 b)z=-1.00——z=1.50 c)z=-0.75——z=2.00 解: p(a)=0.2734-0.0987=0.1747=17.47% p(b)=0.4332+0.3413=0.7745=77.45% p(c)=0.4772+0.2734=0.7506=75.06% 3.有一正态分布μ=75,σ=9,指出下列情况发生的概率: a)该分布中某一样本值小于80的概率,即X<80 b)该分布中某一样本值小于94的概率,即X<94 c)该分布中某一样本值大于63,且小于88的概率,即63 d)从中随机取出一个分数,其值处于72-78之间的概率。 解: a)z(X)=(X-μ)/σ=0.556 P(a)=0.2123+0.5=71.23% b)z(X)=(X-μ)/σ=2.111 p(b)=0.4826+0.5=98.26% c)z(X)=-1.3333 z(Y)=1.4444 p(c)=0.4251+0.4082=0.8333=83.3% d)z(X)=0.3333 z(Y)=0.3333 p(d)=0.1923+0.1923=38.46% 4.一个正偏态的分布均值为100,标准差12.从中随机抽取一个分数,其值大于106的概率是多少? 解: 对于正偏态问题,我们不能具体确定其分布形状,故是个无解问题。 5.一个特殊制作的硬币正面向上的概率是0.8,反面向上的概率是0.2. a)如果掷硬币100次,正面向上的平均期望值是多少? b)如果掷硬币100次,有95次以上正面向上的概率是多少? c)如果掷硬币100次,有95次以下正面向上的概率是多少? d)如果掷硬币100次,有正好95次正面向上的概率是多少? 解: a)Mean=n*P1=80 min{P1,P2}*n=20,sowecantakeitasanormaldistribution. b)Mean=80 SD=4 Z1=(X1-μ)/σ=(95.5-80)/4=3.875 查表得P(Z>3.80)=0.00007,P(Z>3.90)=0.00005 用插值法近似可得P1=0.000065 c)Z2=(X1-μ)/σ=(94.5-80)/4=3.625 查表得P(Z<3.60)=0.9998,P(Z<3.70)=0.9999 用插值法近似可得P2=0.999825 d)P3=0.2^5*0.8^95*(100! )/(5! *95! )=7.668e-6 6.一个是非判断测验有36道题。 如果答对24题或以上算及格,单凭猜测获得及格或以上的概率是多少? 解: min{P1,P2}*n=18,sowecantakeitasanormaldistribution. Mean=18 SD=3 Z=(X-μ)/σ=(23.5-18)/3=1.833 查表得到: P(Z>1.833)=0.0336=3.36% 习题5 1.有一总体μ=60,σ=10。 请指出下列样本对应的z分数: a.样本1: n=4,X=55 解: σX=σ/squar(n)=5 Z=(X-μ)/σx=-1.00 b.样本2: n=25,X=64 解: σX=σ/squar(n)=2 Z=(X-μ)/σx=2.00 c.样本3: n=100,X=62 解: σX=σ/squar(n)=1 Z=(X-μ)/σx=2.00 2.有一正态分布: μ=100,σ=20 a.从中随机抽取一个样本n=25,求其样本平均值μ和σX 解: μ=100 σX=σ/squar(n)=4 b.使用z分数,指出位于此分布中间95%的样本的上下限。 解: 查表得Z=1.96时候,AreabetweenmeanandZis0.4750=95%/2 上限X1=μ+σ*Z=139.2 同理下限X2=60.8 c.现从中取出一样本,均值X=106,n=25,问此样本是否处于分布的两端5%的区域? 解: σX=σ/squar(n)=4 查表得Z=1.64时候,AreabeyondZis0.0505 Z=(X-μ)/σX=1.500<1.64,不在两端5%区域。 3.有一正态总体μ=50,σ=10. a.请问,其中一个样本的值为45-55,即45 解: Z1=(X-μ)/σ=0.500 Z1=(X-μ)/σ=-0.500 查表得: P(45 b.同一分布形态,但容量n=25.,则此时其中一个样本的值为45-55,即45 解: σX=σ/squar(n)=2 Z1=(X-μ)/σX=2.500 Z2=(X-μ)/σX=-2.500 查表得: P(45 4.有一成绩的正态分布μ=75,σ=12. a.如果从中抽取n=4的样本,试问,样本均值为70-80的概率为多少? 解: σX=σ/squar(n)=6 Z1=(X-μ)/σX=0.833 Z2=(X-μ)/σX=-0.833 查表得: P(45 b.如果从中抽取n=16的样本,试问,样本均值为70-80的概率为多少? 解: σX=σ/squar(n)=3 Z1=(X-μ)/σX=1.666 Z2=(X-μ)/σX=-1.666 查表得: P(45 5.有一总体μ=300,σ=80. a.如果从中随机抽取n=25的样本,则样本均值于总体均值间的误差将为多大? 解: σX=σ/squar(n)=16 b.如果从中随机抽取n=100的样本,则样本均值于总体均值间的误差将为多大? 解: σX=σ/squar(n)=8 c.如果从中随机抽取n=400的样本,则样本均值于总体均值间的误差将为多大? 解: σX=σ/squar(n)=4 d.比较以上a,b,c的答案,指出样本容量与标准误之间的关系 解: σX*squar(n)=C 随着n的增大以0.5次方的速度减小。 6讨论假设检验中可能犯的错误: a)什么是I类错误? 为什么会发生? 解: 拒绝H0时所犯的错误。 即侦察到不存在的差异。 可能是由于条件过为严厉造成。 b)什么是II类错误? 它是如何发生的? 解: 接受H0时所犯的错误,即未能侦察到存在的差异。 可能是由于条件过于宽松造成 习题6 16.一位研究者用Alpha=.01的标准作了单尾的假设检验。 在假设检验中,H0被拒绝。 他的同事用同样的数据分析,但用的是Alpha=.05的标准作双尾的考验,结果H0没有被拒绝。 这两个统计分析有没有可能都正确? 解释理由。 答: 不可能都正确。 同事用Alpha=.05的标准作双尾的考验,结果H0没有被拒绝,说明H0分布在两侧Alpha=.025的区域之内。 而第一位研究者用Alpha=.01的标准作了单尾的假设检验,H0被拒绝,说明H0分布在某侧Alpha=.01之外。 显然矛盾。 17.假定一位研究者通常用Alpha=.01的标准作假设检验,但这次他用的是Alpha=.05的标准。 这个Alpha水平的改变对统计效力的大小有什么影响? 其对发生I类错误的风险又有什么影响? 答: 增加了Alpha值,会增加统计的效力大小。 发生一类错误的风险也会增加。 18.一位研究者希望提高统计效力,但同时又想避免发生I类错误。 下面所列的方法哪些可以有助于他达到目的? 解释理由。 a)增加Alpha水平(如,从.05增加到.10) b)用小的Alpha水平,同时增加样本容量 c)使用单尾考验 a能够提高统计效率,但是也会增加I类错误,故难达到目的。 b用小的Alpha水平,故可以避免I类错误;增加样本容量会减少标准误从而增加效力,故可行。 c不改变I类错误的概率,并且如果正确使用单尾将能提高效力。 故也可行。 5.一位研究者编制问卷来测量抑郁水平。 他使用了一个非常多的“正常”个体作标准化群体。 其在这一测验上的均值和标准差为μ=55,σ=12。 分数分布呈正态。 测验中,高分表示抑郁程度高。 为确定测验是否对那些有严重抑郁的个体有足够的敏感性,随机抽取了一个抑郁症病人样本,对其进行测试。 得到一组数据如下: 59,60,60,67,65,90,89,73,74,81, 71,71,83,83,88,83,84,86,85,78,79 病人在这一测验上的分数与正常人显著不同吗? 用Alpha=.01的标准作双尾的假设检验。 X=76.62,则求其Z分数 σX=σ/squar(n)=2.62 Z=(X-μ)/σX=8.251 查表,再用插值法得Alpha=.01的标准作双尾的假设Z1=2.575 则得出结论: 显著不同。 6.一项运动技能任务的操作绩效呈正态分布: μ=20,σ=4。 一位研究者用此任务来检验是否自我意识的增加会影响操作绩效。 研究者预测自我意识的增加会分散注意力,从而降低操作绩效。 随机抽取样本n=16,让被试在大镜子前操作。 得到样本均值X=15.5.用Alpha=.05的标准对研究者预测作假设检验。 解: 研究者预测自我意识的增加会分散注意力,从而降低操作绩效,故采用单尾检验。 Z=(X-μ)/σx=-4.5 查表,再用插值法得Alpha=.05的标准作单尾的假设Z1=-1.645>Z 得出结论: 会分散注意。 7.几个不同因素会影响t统计量的值。 试描述下列因素对t统计量的影响。 在每一种情况中,假设其它的因素都保持恒定 1)样本分数的变异性增加 2)样本容量增加 3)样本均值与假设总体均值的差异增加 答: t=(样本均值-总体均值)/估计标准误,故有 1)样本得变异性增加,导致标准误增加,t减小 2)容量增加,标准误减小,t增加 3)t增加 8.自由度的值与t分布的形状有什么关系? 对于一个特定的Alpha水平,当自由度的值增加时,t的临界值如何变化? 答: 自由度越小,t分布形状越趋于平缓。 自由度增加时候,同样Alpha水平,t的绝对值单调减小。 9.一位研究者想了解在某一领域的成功是否影响一个人的总体自尊水平。 他选取了25个有体育特长的10岁儿童。 对这些儿童实测标准化的自尊量表。 10岁儿童的自尊量表平均得分是µ=70。 他选取的这个样本的均值是X=73,SS=2400。 根据这些数据,能否得出结论体育特长儿童的总体自尊水平较高? step1: H0: µ<70;H1: µ>70; step2: 单尾考验(体育特长儿童的总体自尊水平较高) step3: df? n=25,sodf=25-1=24 step4: 查表求临界t-分数: df=24单尾考验,a=0.05,tcrit=1.711 step5: 计算tobs SS=2400 s=sqroot(SS/n-1)=sqroot(2400/24)=10 估计标准误=s/sqroot(n)=10/sqroot(25)=2 tobs=(X-m)/SE=(73-70)/2=1.500 step6: tobs=1.500 step7: 所以体育特长儿童的总体自尊水平不见得较高。 10.家庭治疗家根据大量调查得到十几岁少年的父母每星期与他们交谈的平均时间是27分钟。 一位研究者对此结论感到出乎意料,亲自进行了一番调查。 他搜集到n=12的样本,发现父母每星期与少年交谈的平均时间如下: 29,22,19,25,27,28,21,22,24,26,30,22 这位研究者的发现与家庭治疗家的结论有显著差异吗? 如果有差异,家庭治疗家是低估还是高估了父母与少年的交谈时间? step1: H0: µ=27;H1: µ=! 27; step2: 双尾考验 step3: df? n=12sodf=12-1=11 step4: 查表求临界t-分数: df=11,双尾考验,a=0.05,tcrit=(+-)2.201 step5: 计算tobs X=24.58 SS=7385-7252.8=132.9 s=sqroot(SS/n-1)=sqroot(134.6/11)=3.50 估计标准误=s/sqroot(n)=3.50/sqroot(12)=1.003 tobs=(X-m)/SE=(24.58-27)/1.003=-2.41 step6: tobs=-2.41 step7: H0–所以家庭治疗家的结论有显著差异 由于是负值,故家庭治疗家是高估了时间。 习题7 1.H0: μA=μB;H1: μA<>μB 判断差异,用双尾检验 df1=n1-1=9;df2=n2-1=19 双尾,α=.01,df=28,Tcrit=+-2.763 Sp2=(Ssa+SSb)/(df1+df2)=1680/28=60 Sd=squar(Sp2/n1+Sp2/n2)=squar(6+3)=3 Tobs=(X1-X2)/Sd=7/3=2.33 所以并没有显著不同。 2. H0: μA=μB;H1: μA>μB 预测低报酬组比高报酬组更容易以为实验真的有趣,用单尾检验 df1=n1-1=19;df2=n2-1=19 单尾,α=.01,df=38,Tcrit=2.457 X1=5.1,X2=2.95 SS1=49.8,SS2=38.95 Sp2=(Ss1+SS2)/(df1+df2)=88.75/38=2.34 Sd=squar(Sp2/n1+Sp2/n2)=squar(0.234)=0.483 Tobs=(X1-X2)/Sd=2.15/0.483=4.449 所以并没有证实这个预测不同。 3. H0: μA=μB;H1: μA>μB 判断有无差异,用双尾检验 df1=n1-1=13;df2=n2-1=13 双尾,α=.05,df=26,Tcrit=+-2.056 X1=7.07,X2=3.14 SS1=36.93,SS2=27.71 Sp2=(Ss1+SS2)/(df1+df2)=64.64/26=2.486 Sd=squar(Sp2/n1+Sp2/n2)=squar(0.355)=0.596 Tobs=(X1-X2)/Sd=3.93/0.596=6.594>Tcrit 所以有显著不同。 4.为了确定日常的体育锻炼多大的运动量适宜,一位研究者用了7组被试,将其年龄,性别,体重,健康状况等有关变量加以匹配。 其中一组被试每星期锻炼2小时,另一组被试每星期锻炼5小时,一段时间后让医生评定其健康状况,得到以下数据。 这些数据是否说明运动量对健康有影响? 被试对 锻炼2小时组 锻炼5小时组 D=X1-X2 D2 A 15 18 -3 9 B 12 14 -2 4 C 16 12 4 16 D 9 11 -2 4 E 13 14 -1 1 F 16 16 0 0 G 17 16 1 1 SUM -3 35 H0: μA=μB;H1: μA<>μB 判断有无影响,用双尾检验 df1=n-1=6 双尾,α=.05,df=6,Tcrit=+-2.447 X=-0.429 S2=(35-3*3/7)/6=5.619 Sd=squar(S2/n)=squar(0.803)=0.896 Tobs=X/Sd=-0.429/0.896=-0.530>Tcrit 所以无显著不同。 5.下表是感觉剥夺1小时前后测得7名被试的听阈。 感觉剥夺实验是否对被试的听阈有显著影响? H0: μA=μB;H1: μA<>μB 判断有无影响,用双尾检验 df=n-1=5 双尾,α=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北大 心理 统计 习题
![提示](https://static.bdocx.com/images/bang_tan.gif)