届二轮理科数学 统计与统计案例 专题卷全国通用.docx
- 文档编号:3468439
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:20
- 大小:201.22KB
届二轮理科数学 统计与统计案例 专题卷全国通用.docx
《届二轮理科数学 统计与统计案例 专题卷全国通用.docx》由会员分享,可在线阅读,更多相关《届二轮理科数学 统计与统计案例 专题卷全国通用.docx(20页珍藏版)》请在冰豆网上搜索。
届二轮理科数学统计与统计案例专题卷全国通用
2020届二轮(理科数学)统计与统计案例专题卷(全国通用)
1.(2019·武汉市调研测试)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:
A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并将收集的数据整理绘制成如下两幅不完整的统计图.请根据图中信息,求本次抽查的学生中A类人数是( )
A.30B.40
C.42D.48
解析:
选A.由条形统计图知,B—自行乘车上学的有42人,C—家人接送上学的有30人,D—其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A—结伴步行上学的有x人,由扇形统计图知,A—结伴步行上学与B—自行乘车上学的学生占60%,所以
=
,解得x=30,故选A.
2.(2019·广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量y(单位:
kW·h)与气温x(单位:
℃)之间的关系,随机选取了4天的用电量与当天气温,并制作了如下对照表:
x(单位:
℃)
17
14
10
-1
y(单位:
kW·h)
24
34
38
a
由表中数据得线性回归方程
=-2x+60,则a的值为( )
A.48B.62
C.64D.68
解析:
选C.由题意,得x=
=10,y=
=
.样本点的中心(x,y)在回归直线
=-2x+60上,代入线性回归方程可得
=-20+60,解得a=64,故选C.
3.(2019·郑州市第二次质量预测)将甲、乙两个篮球队各5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是( )
A.甲队平均得分高于乙队的平均得分
B.甲队得分的中位数大于乙队得分的中位数
C.甲队得分的方差大于乙队得分的方差
D.甲、乙两队得分的极差相等
解析:
选C.由题中茎叶图得,甲队的平均得分x甲=
=29,乙队的平均得分x乙=
=30,x甲 = ×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]= ,乙队得分的方差s = ×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,s >s ,选项C正确;甲队得分的极差为31-26=5,乙队得分的极差为32-28=4,两者不相等,选项D不正确.故选C. 4.(多选)CPI是居民消费价格指数(consumerpriceindex)的简称.居民消费价格指数是一个反映居民家庭一般所购买的消费品和服务项目价格水平变动情况的宏观经济指标.如图是根据国家统计局发布的2017年6月—2018年6月我国CPI涨跌幅数据绘制的折线图(注: 2018年6月与2017年6月相比较,叫同比;2018年6月与2018年5月相比较,叫环比),根据该折线图,则下列结论错误的是 ( ) A.2018年1月至6月各月与去年同期比较,CPI有涨有跌 B.2018年2月至6月CPI只跌不涨 C.2018年3月以来,CPI在缓慢增长 D.2017年8月与同年10月相比较,8月环比更大 解析: 选ABC.A选项,2018年1月至6月各月与去年同期比较,CPI均是上涨的,故A错误;B选项,2018年2月CPI是增长的,故B错误;C选项,2018年3月以来,CPI是下跌的,故C错误;D选项,2017年8月CPI环比增长0.4%,10月环比增长0.3%,故D正确.故选ABC. 二、填空题 5.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________,平均数为________. 解析: 把10场比赛的所得分数按顺序排列为5,8,9,10,14,16,16,19,21,24,中间两个为14与16,故中位数为 =15,平均数为 (5+8+9+10+14+16+16+19+21+24)=10.2. 答案: 15 10.4 6.已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为________. 解析: 根据方差的性质可知,a2×2=8,故a=2. 答案: 2 7.给出下列四个命题: ①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,如果7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23; ②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同; ③若一组数据a,0,1,2,3的平均数为1,则其标准差为2; ④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为 = + x,其中 =2,x=1,y=3,则 =1. 其中真命题有________(填序号). 解析: 在①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为 (1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a+0+1+2+3=5,解得a=-1,故样本的方差为 [(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为 ,故③是假命题;在④中,回归直线方程为 = x+2,又回归直线过点(x,y),把(1,3)代入回归直线方程 = x+2,得 =1,故④是真命题. 答案: ②④ 三、解答题 8.(2019·兰州市诊断考试)“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表: 平均每周进行长跑训练天数 不大于2 3或4 不少于5 人数 30 130 40 若某人平均每周进行长跑训练天数不少于5,则称其为“热烈参与者”,否则称为“非热烈参与者”. (1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数; (2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关? 热烈参与者 非热烈参与者 总计 男 140 女 55 总计 附: K2= (n为样本容量) P(K2≥k0) 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 1.841 3.024 4.635 5.879 8.828 解: (1)以200人中“热烈参与者”的频率作为概率,则该市“热烈参与者”的人数约为20000× =4000. (2)2×2列联表为 热烈参与者 非热烈参与者 总计 男 35 105 140 女 5 55 60 总计 40 160 200 K2= ≈5.292>4.635, 故能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关. 11.(2019·武汉市调研测试)中共十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加. 为了更好地制定2019年关于加快提升农民年收入,力争早日脱贫的工作计划,该地扶贫办统计了2018年50位农民的年收入(单位: 千元)并制成如下频率分布直方图: (1)根据频率分布直方图,估计50位农民的年平均收入x(单位: 千元)(同一组数据用该组数据区间的中点值表示). (2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布N(μ,σ2),其中μ近似为年平均收入x,σ2近似为样本方差s2,经计算得s2=4.92.利用该正态分布,解决下列问题: (i)在2019年脱贫攻坚工作中,若使该地区约有占总农民人数的82.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元? (ii)为了调研“精准扶贫,不落一人”的落实情况,扶贫办随机走访了1000位农民.若每个农民的年收入相互独立,问: 这1000位农民中年收入不少于10.14千元的人数最有可能是多少? 附: 参考数据与公式 ≈2.63,若X~N(μ,σ2),则 ①P(μ-σ ②P(μ-2σ ③P(μ-3σ 解: (1)x=10×0.04+14×0.10+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=15.40(千元). (2)由题意,X~N(15.40,4.92). (i)P(X>μ-σ)≈ + ≈0.8414, μ-σ≈15.40-2.63=10.77, 即最低年收入大约为10.77千元. (ii)由P(X≥10.14)=P(X≥μ-2σ)≈0.5+ ≈0.9773,得每个农民的年收入不少于10.14千元的事件的概率为0.9773,记这1000位农民中年收入不少于10.14千元的人数为ξ,则ξ~B(103,p),其中p=0.9773,于是恰好有k位农民的年收入不少于10.14千元的事件的概率是P(ξ=k)=Ck103pk(1-p)103-k, 从而由 = >1,得k<1001p, 由 = >1,得k>1001p-1, 而1001p=976.2773, 所以,975.2773 由此可知,在所走访的1000位农民中,年收入不少于10.14千元的人数最有可能是976. 8.(2019·洛阳市统考)某学校高三年级共有4个班,其中实验班和普通班各2个,且各班学生人数大致相当.在高三第一次数学统一测试(满分100分)成绩揭晓后,教师对这4个班的数学成绩进行了统计分析,其中涉及试题“难度”和“区分度”等指标.根据该校的实际情况,规定其具体含义如下: 难度= ,区分度= . (1)现从这4个班中各随机抽取5名学生,根据这20名学生的数学成绩,绘制茎叶图如下: 请根据以上样本数据,估计该次考试试题的难度和区分度; (2)为了研究试题的区分度与难度的关系,调取了该校上一届高三6次考试的成绩分析数据,得到下表: 考试序号 1 2 3 4 5 6 难度x 0.65 0.71 0.73 0.76 0.77 0.82 区分度y 0.10 0.16 0.16 0.19 0.20 0.13 ①用公式r= 计算区分度y与难度x之间的相关系数r(精确到0.001); ②判断y与x之间相关关系的强与弱,并说明是否适宜用线性回归模型拟合y与x之间的关系. 参考数据: xiyi=0.7134, ≈0.0092. 解: (1)由茎叶图知,实验班这10人的数学总成绩为860分,普通班这10人的数学总成绩为700分, 故这20人的数学平均成绩为 =78(分),由此估计这4个班的平均分为78分, 所以难度= =0.76. 由 =86估计实验班的平均分为86分,由 =70估计普通班的平均分为70分, 所以区分度= =0.14. (2)①由于 (xi-x)(yi-y) = (xiyi-yxi-xyi+xy) = xiyi-y xi-x yi+nx y = xiyi-nx y-nx y+nx y = xiyi-nx y, 且 xiyi=0.7134, ≈0.0092, 6x y=6×0.74×0.16=0.7104, 所以r= = ≈ ≈0.324. ②由于r≈0.326∈[0.30,0.75),故两者之间相关性非常一般,不适宜用线性回归模型拟合y与x之间的关系,即使用线性回归模型来拟合,效果也不理想. [B组 大题增分专练] 1.(2019·济南市七校联合考试)“黄梅时节家家雨”“梅雨如烟暝村树”“梅雨暂收斜照明”……江南梅雨的点点滴滴都流润着浓烈的诗情.每年六、七月份,我国长江中下游地区进入持续25天左右的梅雨季节,如图是江南Q镇2009~2018年梅雨季节的降雨量(单位: mm)的频率分布直方图,试用样本频率估计总体概率,解答下列问题: (1)“梅实初黄暮雨深”,请用样本平均数估计Q镇明年梅雨季节的降雨量; (2)“江南梅雨无限愁”,Q镇的杨梅种植户老李也在犯愁,他过去种植的甲品种杨梅,亩产量受降雨量的影响较大(把握超过八成),而乙品种杨梅2009~2018年的亩产量(单位: kg)与降雨量的发生频数(年)如2×2列联表所示(部分数据缺失),请你帮助老李排解忧愁,他来年应该种植哪个品种的杨梅受降雨量影响更小? (完善列联表,并说明理由) 降雨量 亩产量 [200,400) [100,200)∪[400,500] 总计 <600 2 ≥600 1 总计 10 附: K2= ,其中n=a+b+c+d. P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 k0 0.455 0.708 1.323 2.072 2.706 解: (1)频率分布直方图中第四组的频率为1-100×(0.002+0.004+0.003)=0.1. 所以用样本平均数估计Q镇明年梅雨季节的降雨量为 150×0.2+250×0.4+350×0.3+450×0.1=30+100+105+45=280(mm). (2)根据频率分布直方图可知,降雨量在[200,400)内的频数为10×100×(0.003+0.004)=5. 进而完善列联表如下. 降雨量 亩产量 [200,400) [100,200)∪[400,500] 总计 <600 2 2 4 ≥600 5 1 6 总计 7 3 10 K2= = ≈1.270<1.321. 故认为乙品种杨梅的亩产量与降雨量有关的把握不足75%.而甲品种杨梅受降雨量影响的把握超过八成,故老李来年应该种植乙品种杨梅受降雨量影响更小. 2.(2019·佛山模拟)表中的数据是一次阶段性考试某班的数学、物理原始成绩: 学号 1 2 3 4 5 6 7 8 9 10 11 10 13 14 15 16 17 18 19 20 21 22 数学 117 108 96 113 136 139 104 104 101 115 115 103 105 117 103 102 132 109 96 105 106 100 物理 80 84 83 85 89 81 91 78 85 91 72 76 87 82 79 82 84 89 63 73 77 45 学号 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 数学 108 137 87 95 108 117 104 108 105 74 81 135 101 97 116 102 76 100 62 86 100 101 物理 76 80 71 57 72 65 69 79 0 55 56 77 63 70 75 63 59 64 42 62 77 65 用这44人的两科成绩制作如下散点图: 学号为22号的A同学由于严重感冒导致物理考试发挥失常,学号为31号的B同学因故未能参加物理学科的考试,为了使分析结果更客观准确,老师将A,B两同学的成绩(对应于图中A,B两点)剔除后,用剩下的42个同学的数据作分析,计算得到下列统计指标: 数学学科平均分为18.5,标准差为16.36,物理学科的平均分为74,标准差为918,数学成绩x与物理成绩y的相关系数r=0.8222,回归直线l(如图所示)的方程为 =0.5006x+16.66. (1)若不剔除A,B两同学的数据,用全部44人的成绩作回归分析,设数学成绩x与物理成绩y的相关系数为r0,回归直线为l0,试分析r0与r的大小关系,并在图中画出回归直线l0的大致位置. (2)如果B同学参加了这次物理考试,估计B同学的物理分数(精确到个位). (3)就这次考试而言,学号为16号的C同学数学与物理哪个学科成绩要好一些? (通常为了比较某个学生不同学科的成绩水平,可按公式Zi= 统一化成标准分再进行比较,其中xi为学科原始成绩,x为学科平均分,s为学科标准差) 解: (1)r0 ①离群点A,B会降低变量间的线性关联程度; ②44个数据点与回归直线l0的总偏差更大,回归效果更差,所以相关系数更小; ③42个数据点与回归直线l的总偏差更小,回归效果更好,所以相关系数更大; ④42个数据点更加贴近回归直线l; ⑤44个数据点与回归直线l0更离散. 其他言之有理的理由均可. (直线l0的斜率须大于0且小于l的斜率,具体位置稍有出入没关系,无需说明理由) (2)将x=105代入 =0.5006x+16.68中, 得y=62.575+16.68≈81, 所以估计B同学的物理分数大约为81分. (3)由表中数据知C同学的数学原始成绩为102分,物理原始成绩为82分, 则数学标准分Z16= = = ≈0.63, 物理标准分Z′16= = = ≈0.72, 因为0.72>0.63,所以C同学物理成绩比数学成绩要好一些. 1.(2019·济南市模拟考试)某客户准备在家中安装一套净水系统,该系统为三级过滤,使用寿命为十年.如图所示,两个一级过滤器采用并联安装,二级过滤器与三级过滤器为串联安装. 其中每一级过滤都由核心部件滤芯来实现.在使用过程中,一级滤芯和二级滤芯都需要不定期更换(每个滤芯是否需要更换相互独立),三级滤芯无需更换.若客户在安装净水系统的同时购买滤芯,则一级滤芯每个80元.二级滤芯每个160元.若客户在使用过程中单独购买滤芯,则一级滤芯每个200元,二级滤芯每个400元.现需决策安装净水系统的同时购买滤芯的数量,为此参考了根据100套该款净水系统在十年使用期内更换滤芯的相关数据制成的图表,其中图1是根据200个一级过滤器更换的滤芯个数制成的柱状图,表1是根据100个二级过滤器更换的滤芯个数制成的频数分布表. 二级滤芯更换的个数 5 6 频数 60 40 表1 以200个一级过滤器更换滤芯的频率代替1个一级过滤器更换滤芯发生的概率,以100个二级过滤器更换滤芯的频率代替1个二级过滤器更换滤芯发生的概率. (1)求一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30的概率; (2)记X表示该客户的净水系统在使用期内需要更换的一级滤芯总数,求X的分布列及数学期望; (3)记m,n分别表示该客户在安装净水系统的同时购买的一级滤芯和二级滤芯的个数,若m+n=28,且n∈{5,6},以该客户的净水系统在使用期内购买各级滤芯所需总费用的期望值为决策依据,试确定m,n的值. 解: (1)由题意可知,若一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30,则该套净水系统中的两个一级过滤器均需更换10个滤芯,二级过滤器需要更换6个滤芯. 设“一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30”为事件A,因为一个一级过滤器需要更换10个滤芯的概率为0.4,二级过滤器需要更换6个滤芯的概率为0.4,所以P(A)=0.4×0.4×0.4=0.062. (2)由柱状图可知, 一个一级过滤器需要更换的滤芯个数为10,11,10,对应的概率分别为0.2,0.4,0.4,由题意,X可能的取值为20,21,22,23,24,并且P(X=20)=0.2×0.2=0.04, P(X=21)=0.2×0.4×2=0.16, P(X=22)=0.4×0.4+0.2×0.4×2=0.32, P(X=23)=0.4×0.4×2=0.32, P(X=24)=0.4×0.4=0.14. 所以X的分布列为 X 20 21 22 23 24 P 0.04 0.16 0.32 0.32 0.16 E(X)=20×0.04+21×0.16+22×0.32+23×0.32+24×0.16=22.2. (3)因为m+n=28,n∈{5,6},所以若m=22,n=6, 则该客户在十年使用期内购买各级滤芯所需总费用的期望值为 22×80+200×0.32+400×0.16+6×160=2846. 若m=23,n=5, 则该客户在十年使用期内购买各级滤芯所需总费用的期望值为 23×80+200×0.16+5×160+400×0.4=2832. 故m,n的值分别为23,3. 2.某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去50周的资料显示,该地周光照量X(单位: 小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图. (1)依据折线图,是否可用线性回归模型拟合y与x的关系? 请计算相关系数r并加以说明(精确到0.01);(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合) (2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系: 周光照量X(单位: 小时) 30 50≤X≤70 X>70 光照控制仪运行台数 3 2 1 若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台? 附相关系数公式: r= , 参考数据: ≈0.55, ≈0.93. 解: (1)由已知数据可得x= =5,y= =2. 因为 (xi-x)(yi-y)=(-3)×(-1)+0+0+0+3×1=6, = =2 , = = , 所以相关系数r= = = ≈0.93. 因为|r|>0.75,所以可用线性回归模型拟合y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 届二轮理科数学 统计与统计案例 专题卷全国通用 二轮 理科 数学 统计 案例 专题 全国 通用