第十二讲 算法与统计Word格式.docx
- 文档编号:18702252
- 上传时间:2022-12-31
- 格式:DOCX
- 页数:17
- 大小:240.84KB
第十二讲 算法与统计Word格式.docx
《第十二讲 算法与统计Word格式.docx》由会员分享,可在线阅读,更多相关《第十二讲 算法与统计Word格式.docx(17页珍藏版)》请在冰豆网上搜索。
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
3.统计图表
(1)在频率分布直方图中:
①各小矩形的面积表示相应各组的频率,各小矩形的高=
;
②各小矩形面积之和等于1;
③中位数左右两侧的直方图面积相等,因此可以估计其近似值.
(2)茎叶图
当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).
3.样本的数字特征
(1)众数
在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据).
(2)中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.
(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.
4.变量间的相关关系
(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x和y具有线性相关关系.
(2)用最小二乘法求回归直线的方程
设线性回归方程为
=
x+
,则
.
注意:
回归直线一定经过样本的中心点(
,
),据此性质可以解决有关的计算问题.
【命题热点突破】
考点一:
程序框图
例1、(2013·
辽宁理,8)执行如图所示的程序框图,若输入n=10,则输出S=( )
A.
B.
C.
D.
(1)
(2)
变式1、(2014·
唐山市二模)执行下边的程序框图,若输出的S是2047,则判断框内应填写( )
A.n≤9?
B.n≤10?
C.n≥10?
D.n≥11?
变式2、(2014·
北京西城区模拟)如图所示的程序框图表示求算式“2×
3×
5×
9×
17”的值,则判断框内可以填入( )
A.k≤10B.k≤16C.k≤22D.k≤34
考点2:
抽样方法
例2、(2014·
新乡、许昌、平顶山调研)某高校共有450名学生参加环保知识测试,其中男生250名,女生200名,已知所有学生的成绩均大于60且小于等于100,现按性别用分层抽样的方法从中抽取45名学生的成绩,从男生和女生中抽查的结果分别如表1和表2:
表1
成绩分组
(60,70]
(70,80]
(80,90]
(90,100]
人数
3
m
8
6
表2
2
5
n
4
(1)求m,n的值,
(2)记表2中分组在(60,70]中的2名女生为A、B,(90,100]中的4名女生为C、D、E、F,现从表2中(60,70]的女生中抽取1人,从(90,100]的女生中抽取2人做专题发言,求(60,70]中的女生A和(90,100]中的女生C同时被抽到的概率是多少?
变式3、(2013·
湖南文,3)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件,为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.9 B.10 C.12 D.13
考点3:
用样本估计总体
例3、(文)某学校为了调查学生平均每周的上网时间(单位:
h)对学习产生的影响,从高三年级随机抽取了100名学生,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1:
3:
5,试估计:
(1)该学校学生平均每周上网时间少于4小时的学生人数是多少?
(2)为了调查上网时间对学习的影响程度,学校决定在平均每周上网时间少于4小时的学生中利用分层抽样法抽取4名学生,然后再随机抽取2名学生进行学习效率等方面的调查,求平均每周上网时间在2~4小时内的学生有2名被抽到的概率.
变式4、(理)“根据《中华人民共和国道路交通安全法》规定:
车辆驾驶员血液酒精浓度在20~80mg/100mL(不含80)之间,属于酒后驾车,血液酒精浓度在80mg/100mL(含80)以上时,属醉酒驾车.”
2011年4月15日晚8时开始某市交警一队在该市一交通岗前设点对过往的车辆进行抽查,经过两个小时共查出酒后驾车者60名,图1是用酒精测试仪对这60名酒后驾车者血液中酒精浓度进行检测后依所得结果画出的频率分布直方图.
(1)求这60名酒后驾车者中属于醉酒驾车的人数;
(图1中每组包括左端点,不包括右端点)
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,上图的程序框图是对这60名酒后驾车者血液的酒精浓度做进一步的统计,求出上图输出的S值,并说明S的统计意义;
(图2中数据mi与fi分别表示图1中各组的组中值及频率)
(3)本次行动中,吴、李两位先生都被酒精测试仪测得酒精浓度在70mg/100mL(含70)以上,但他俩坚称没喝那么多,是测试仪不准,交警大队陈队长决定在被酒精测试仪测得酒精浓度在70mg/100mL(含70)以上的酒后驾车者中随机抽出2人抽血检验,求吴、李两位先生至少有1人被抽中的概率.
考点4:
回归分析及其应用
例4、班主任为了对本班学生的考试成绩进行分析,决定从全班25位女同学,24位男同学中随机抽取一个容量为8的样本进行分析.若这8位同学的数学、物理分数对应如下表:
学生编号
1
2
3
4
5
6
7
8
数学分数x
60
65
70
75
80
85
90
95
物理分数y
72
77
84
88
93
上表数据表示变量y与x的相关关系.
(1)画出样本的散点图,并说明物理分数y与数学分数x之间是正相关还是负相关;
(2)求y与x的线性回归直线方程(系数精确到0.01),并指出某学生数学83分,物理约为多少分(精确到1分)?
参考公式:
回归直线的方程是:
其中
-
课堂检测
一、选择题
1.(2014·
东北三省三校一模)执行如图所示的程序框图,若输入如下四个函数:
①f(x)=sinx,②f(x)=cosx,③f(x)=
,④f(x)=x2,则输出的函数是( )
A.f(x)=sinxB.f(x)=cosx
C.f(x)=
D.f(x)=x2
2、(理)(2014·
山西省重点中学四校联考)执行如图所示的程序框图,则输出S的值为( )
A.3B.-6C.10D.-15
3、下面框图所给的程序运行结果为S=28,那么判断框中应填入的关于k的条件是( )
A.k=8?
B.k≤7?
C.k<
7?
D.k>
4.(2013·
新课标Ⅱ理,6)执行下面的程序框图,如果输入的N=10,那么输出的S=( )
A.1+
+
+…+
B.1+
C.1+
D.1+
5.(2014·
山西省重点中学第三次四校联考)已知x、y的取值如下表所示:
x
1
y
0.9
1.9
3.2
4.4
从散点图分析,y与x线性相关,且
=0.8x+a,则a=( )
A.0.8 B.1
C.1.2 D.1.5
6、(文)(2014·
豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为3∶2∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为( )
A.20B.40
C.60D.80
7、(理)(2013·
济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取( )
A.65人,150人,65人B.30人,150人,100人
C.93人,94人,93人D.80人,120人,80人
8、(2014·
新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为( )
A.100B.120
C.150D.200
9、(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:
[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”,则图中x的值为( )
A.0.01B.0.02
C.0.03D.0.04
10、(2014·
东北三校二模)在某次测量中得到的A样本数据如下:
42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是( )
A.平均数B.标准差
C.众数D.中位数
11.(2014·
石家庄质检)等差数列x1,x2,x3,…,x9的公差为1,若以上述数据x1,x2,x3,…,x9为样本,则此样本的方差为( )
C.60D.30
二、填空题
12.下图是一个算法流程图,则输出的k的值是________.
(12)(13)
(注:
k←1的含义与k=1相同)
13、(理)如图所示,程序框图(算法流程图)的输出结果是________.
14.(2013·
天津六校联考)阅读如图所示的程序框图,运行相应的程序,若输入x的值为-5,则输出的y值是( )
A.-1 B.1 C.2 D.
15.(2013·
哈三中模拟)阅读下面的程序框图,输出结果s的值为( )
B.
C.
D.
16.(2013·
江西师大附中、鹰潭一中联考)张老师给学生出了一道题,“试写一个程序框图,计算S=1+
”.发现同学们有如下几种做法,其中有一个是错误的,这个错误的做法是( )
17.若执行如下图所示的框图,输入x1=1,x2=2,x3=4,x4=8,则输出的数等于________.
18.(2013·
烟台质检)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为________.
三、解答题
19.(文)(2014·
东北三省三校二模)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分.上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:
第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到的频率分布直方图如图所示.
(1)分别求第三,四,五组的频率;
(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率.
20.(文)(2014·
重庆文,17)20名学生某次数学考试成绩(单位:
分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;
(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.
21.(文)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:
分组
频数
频率
一
60.5~70.5
a
0.26
二
70.5~80.5
15
c
三
80.5~90.5
18
0.36
四
90.5~100.5
b
d
合计
50
e
(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;
(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;
(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.
22、(理)(2012·
山西省高考联合模拟)为了了解某年级1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13s与18s之间,将成绩按如下方式分成五组:
第一组[13,14);
第二组[14,15);
……;
第五组[17,18].按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右的前3个组的频率之比为3819,且第二组的频数为8.
(1)将频率当作概率,求调查中随机抽取了多少个学生的百米成绩;
(2)若从第一、五组中随机取出两个成绩,求这两个成绩的差的绝对值大于1秒的概率.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二讲 算法与统计 第十二 算法 统计