高一数学《概率与统计》.doc
- 文档编号:108661
- 上传时间:2022-10-03
- 格式:DOC
- 页数:19
- 大小:2.23MB
高一数学《概率与统计》.doc
《高一数学《概率与统计》.doc》由会员分享,可在线阅读,更多相关《高一数学《概率与统计》.doc(19页珍藏版)》请在冰豆网上搜索。
概率默统计类
第6讲
6.1随机抽样
考点1:
抽样方法
知识点睛
一.随机抽样
随机抽样:
满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:
1.简单随机抽样:
从元素个数为的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.简单随机抽样是最简单、最基本的抽样方法.
⑴抽出办法:
①抽签法:
用纸片或小球分别标号后抽签的方法.
②随机数表法:
随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同.随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.
⑵简单随机抽样必须具备下列特点:
①简单随机抽样要求被抽取的样本的总体个数是有限的.
②简单随机样本数小于等于样本总体的个数.
③简单随机样本是从总体中逐个抽取的.
④简单随机抽样是一种不放回的抽样.
⑤简单随机抽样的每个个体被抽取的可能性均为.
<教师备案>样本获取分为两种,一种是全面统计,一种是样本统计.
全面统计的例子非常多,比如美国大选,每个州的选民都是通过投票选出每个州的负责人.也就是每个人都表达了自己的意见.再比如我们调查学生是海淀还是非海淀,我们也是给每个学生打了电话,访谈出结果,每个同学也都表达了自己的意见.再比如一些小事,像一群人中午的时候讨论去哪吃饭,每个人都可以说自己喜欢的地方.
全面统计的好处在于无遗漏,数据准确无偏差,但是缺点也很明显,那就是非常的繁琐、麻烦.对于大数据的处理很无力,所以我们需要有样本统计.
样本统计的意义就是从一个大数据中抽取数据样本分析,通过对样本的分析来估计原数据的性质.于是首要的问题就是如何抽样.一个合理的抽样方法的基本要求是“平等”,也就是每个个体被抽取的可能性是相同的.比如我们发现,老师选出的学生代表很可能不能真正代表全体同学的意见,因为老师选取的一定是自己比较熟悉的学生,这类学生平时一定非常活跃.而对于一些比较内向,“存在感”比较低的同学来说,老师可能就不会关注,被选中的可能性就会降低.由此可以推知,人为的抽样一般是不靠谱的.再比如,现在很多的新闻都有网上的调查,有的媒体通过网上调查的数据来分析广大人民对新闻的反馈.这样的调查也是不靠谱的,因为网上调查反映出来的大多是经常上网的人的意见,而对于平时不上网的人就没有调查,所以这样的抽样也是不合理的.
最常见的合理抽样方式是“抓阄”,这可以保证每个个体都能“等可能”的被选中.当然抓阄的方式有很多,比如很多时候我们不需要每个人都去抓一次,我们可以把每个人编一个号,然后由一个人来抽号就可以了.比如我们常见的彩票大致就是这个原理.不过需要注意的是彩票里面的等可能是对彩票是等可能的,对人不一样,因为一个人可以买很多彩票.
<教师备案>老师在讲完简单随机抽样后可以让学生做例1的【铺垫】⑴,本小题主要是让学生理解什么是总体,什么是个体,什么是样本容量,因为简单随机抽样比较简单,而且在后边要讲的系统抽样和分层抽样中都要用到,所以这里就不再详细讲解了.
2.系统抽样:
将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.
⑴抽出办法:
从元素个数为的总体中抽取容量为的样本,如果总体容量能被样本容量整除,设,先对总体进行编号,号码从到,再从数字到中随机抽取一个数作为起始数,然后顺次抽取第个数,这样就得到容量为的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.
⑵系统抽样时,当总体个数恰好是样本容量的整数倍时,取;若不是整数时,先从总
体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等为.
<教师备案>随着数量的增大,抓阄的方式效率会比较低.当然,随着现在计算机的发展,数据量很大的时候也是可以通过“选号”的方式进行随机抽样.课本上提到的系统抽样其实现在已经不怎么使用了.不过作为传统意义下的抽样方法,我们还是有必要介绍一下.
系统抽样的核心是“选出代表”,每个代表会直接代表一个群体的意见.系统抽样的方式分为两种,一种是横向抽样,也就是我们教科书上的抽样方式,这种例子非常多,比如军训的时候,可能我们出现过“一到三”报数,这样就把我们分成了“一”“二”“三”三个组,然后就可以随机选一个数“一”,然后所有的“一”就被选中了.同样的道理,我们对人,选取一个人的样本,那么我们就需要把总数分成组,每组个人,然后让第一组的人抓阄(为的是随机抽样),比如“”抓到,那么每一组的“”就被选中了.
另一种系统抽样的方式是“纵向抽样”,它出现的原理是这样的:
原始的系统抽样方法会造成直观上的不公平.比如我们人里面选人去叙利亚旅游,大家肯定都不愿意去,第一组的人抓阄之后,由于第一组的号被选中,那么每一组的号就都被选中了,其他组的号会认为被第一组的号连累,因为他们是“被”选中的.虽然从可能性上说,这没有道理,不过直观上确实有点“躺枪”的意思.于是人们改变了方式,也就是纵向系统抽样.比如现在我们还是人里面选人去叙利亚,我们把所有人分成组,每组人,然后每组自行推举一个代表上台抓阄,被选中的人所在的组,整组都被选中.这样我们每个组都有人去抓阄,也就实现了直观上的公平.但是在可能性的角度,横向和纵向抽样都是“等可能”的,没有本质区别.
<教师备案>老师在讲完系统抽样后就可以让学生做例1的铺垫⑵,例1⑵以及尖子班拓展⑵,这几个题都是系统抽样,老师可以选择几个让学生做做,不一定都让学生做,老师自己选择.
3.分层抽样:
当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.
<教师备案>简单随机抽样(抓阄)和系统抽样都是绝对意义上的公平,但是分层抽样就是相对意义上的公平,因为我们人为的干扰了抽样的过程.不过现实意义之下我们统计数据必须进行分层,否则统计数据会闹出笑话.常见的一个就是我家房子平米,后来搬过来一个邻居,房子面积是平米,那么我家的生活状况有没有改变.实际上没有,但是统计数字可能告诉你,你们的平均面积增加了.现实生活中,很多的统计需要分层,比如统计收入水平的时候需要分不同的城市,统计生育问题的时候要分城市和农村,统计化妆品消费水平的时候要分性别等等.所以分层抽样就是为了保证每个层面上的公平性,我们按照每个层次占到总体的多少来分配选取的比例.这里老师可以开发更多的统计实例,一定要讲出现实意义来.
<教师备案>老师在讲完分层抽样后可以让学生做例1的铺垫⑶,例1⑶以及目标班专用⑷,让学生熟练掌握分层抽样,因为在以后考试和北京高考中,三个抽样重点考察分层抽样.老师在讲完三个抽样后一定要让学生明白什么情况下用什么抽样,这个时候就可以让学生做例1⑴,尖子班拓展⑴.
经典精讲
【铺垫】⑴为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,
下列说法中正确的有()个
①名运动员是总体;②每个运动员是个体;③所抽取的名运动员是一个样本;
④样本容量为;⑤每个运动员被抽到的概率相等
A. B.C.D.
⑵从编号为的枚最新研制的某种型号的导弹中随机抽取枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取枚导弹的编号可能是()
A.B.
C.D.
⑶某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有种、种、种、种,现从中抽取一个容量为的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()
A.B.C. D.
【解析】⑴B;④⑤正确,①②③错误
⑵B;
⑶C;.
【例1】三种抽样
⑴现有以下两项调查:
①某装订厂装订图书册,要求检验员从中抽取册图书,检
查其装订质量状况;②某市有大型、中型与小型的商店共家,三者数量之比为
.为了调查全市商店每日零售额情况,抽取其中家进行调查.完成①、②这两项
调查宜采用的抽样方法依次是()
A.简单随机抽样法,分层抽样法B.分层抽样法,简单随机抽样法
C.分层抽样法,系统抽样法D.系统抽样法,分层抽样法
⑵用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(号,号,…,号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是.
⑶某工厂生产、、三种不同型号的产品,产品数量之比依次为.现用分层抽样方法抽出一个容量为的样本,样本中种型号产品有件.那么此样本的容量.
⑷(目标班专用)某校有名学生,型血的有人,型血的有人,型血的
有人,为了研究血型与色弱有没有关系,要从中抽取一个人的样本,按分层抽样,型血应抽取的人数为人.
【解析】⑴D;①是系统抽样;②明显是分层抽样;
⑵;不妨设第1组抽出的号码为,则第16组应抽出的号码是,∴.
⑶;种型号的产品占总体的比例是,则样本容量.
⑷该学校型血的人数为,按照分层抽样的抽样比相等得:
,解得,即型血应抽取的人数为人.
6.2用样本估计总体
<教师备案>学习了抽样后,需要对收集的这些有代表性的样本数据进行研究,找出有用的信息,然后用这些样本来估计总体.这种估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征.用来估计的图表和方法有很多种,本版块在初中的基础上来学习频率分布直方图、茎叶图和方差.
考点2:
频率分布直方图
知识点睛
1.列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:
找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:
取组距,用决定组数;
③决定分点:
决定起点,进行分组;
④列频率分布表:
对落入各小组的数据累计,算出各小组的频数,除以样本容量,得到各小组的频
率.
⑤绘制频率分布直方图:
以数据的值为横坐标,以的值为纵坐标绘制直方图,
知小长方形的面积=组距×=频率.
2.频率分布折线图:
将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
3.总体密度曲线:
样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
<教师备案>这里主要介绍的就是样本分析方法,直方图就是很重要的一种.其实直方图的形成过程就是把数据按大小排序,然后分段截取数据.实际生活中最常见的方法就是“画正字”,比如我们收到了一组数据是学生的跳绳次数,我们就可以把次数分成若干组,然后一个一个数据看落在了哪个组里,利用“画正字”的方式看出每组里有几个数,最后画出直方图.直方图的主要作用是看出数据的分布变化趋势,很容易表示大量数据,缺点是原始数据不能在图上表示出来.
通过例2的学习,让学生可以由给出的频率分布直方图算出各组数据的频率和频数,理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率与统计 数学 概率 统计