完整word版高中必修三统计知识点整理0607191608.docx
- 文档编号:27220148
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:26
- 大小:299.85KB
完整word版高中必修三统计知识点整理0607191608.docx
《完整word版高中必修三统计知识点整理0607191608.docx》由会员分享,可在线阅读,更多相关《完整word版高中必修三统计知识点整理0607191608.docx(26页珍藏版)》请在冰豆网上搜索。
完整word版高中必修三统计知识点整理0607191608
高中数学必修3知识点总结
第二章统计
2.1.1简单随机抽样
1.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:
每个
样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其
它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
2.简单随机抽样常用的方法:
(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:
①总体变异情况;②允许误差范围;③概率保证程度。
3.抽签法:
(1)给调查对象群体中的每一个对象编号;
(2)准备抽签的工具,实施抽签
(3)对样本中的每一个个体进行测量或调查
例:
请调查你所在的学校的学生做喜欢的体育活动情况。
4.随机数表法:
例:
利用随机数表在所在的班级中抽取10位同学参加某项活动。
2.1.2系统抽样
1.系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的
办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)
前提条件:
总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调
查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性
规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,
如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估
计精度。
2.1.3分层抽样
1.分层抽样(类型抽样)
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用
简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:
1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有
的样本进而代表总体。
分层标准:
(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。
(3)以那些有明显分层区分的变量作为分层变量。
3.分层的比例问题:
(1)按比例分层抽样:
根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(2)不按比例分层抽样:
有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次
的子总体进行专门研究或进行相互比较。
如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样
本中各层的比例,使数据恢复到总体中各层实际的比例结构。
例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请
用抽签法和随机数表法设计抽样方案.
解抽签法:
第一步:
将18名志愿者编号,编号为1,2,3,,,18.
第二步:
将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;
第三步:
将18个号签放入一个不透明的盒子里,充分搅匀;
第四步:
从盒子中逐个抽取6个号签,并记录上面的编号;
第五步:
所得号码对应的志愿者,就是志愿小组的成员.
随机数表法:
第一步:
将18名志愿者编号,编号为01,02,03,,,18.
第二步:
在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;
第三步:
从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,
07,15,13,02,09.
第四步:
找出以上号码对应的志愿者,就是志愿小组的成员
例2某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行体具实施.
解
(1)将每个人随机编一个号由0001至1003.
(2)利用随机数法找到3个号将这3名工人剔除
(3)将剩余的1000名工人重新随机编号由0001至1000.
1000
10段,每段含100个工人
4)分段,取间隔k=10=100将总体均分为
5)从第一段即为0001号到0100号中随机抽取一个号l.
(6)按编号将l,100+l,200+l,,,900+l共10个号码选出,这10个号码所对应的工人组成样本.
300人
例3(14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个
的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出体具过程
解应采取分层抽样的方法.
过程如下:
(1)将3万人分为五层,其中一个乡镇为一层.
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.
32
300×15=60(人);300×15
=40(人);
52
300×15=100(人);300×15
=40(人);
3
300×15
=60(人),
因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.
(3)将300人组到一起即得到一个样本.
2.1.4用样本的数字特征估计总体的数字特征
2、.样本标准差:
样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,
而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.
(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变
3)一组数据中的最大值和最小值对标准差的影区间,响(x3s,x3s)的应用;“去掉一个最高分,去掉一个最低分
100=99;
98
稳定.
例2(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔
记录抽查数据如下:
甲:
102,101,99,98,103,98,
乙:
110,115,90,85,75,115,
(1)这种抽样方法是哪一种?
(2)将这两组数据用茎叶图表示;
(3)将两组数据比较,说明哪个车间产品较稳定.
解
(1)因为间隔时间相同,故是统系抽样.
30min抽取一包产品,称其重量,分别
99;
110.
(2)茎叶图如下:
(3)甲车间:
平均值:
1
x=1(102+101+99+98+103+98+99)=100,
17
方差:
s1[(102-100)2+(101-100)2+,+(99-100)2]≈3.4286.
2=7
12=
乙车间:
平均值:
x2=1(110+115+90+85+75+115+110)=100,
7
方差:
s1[(110-100)2+(115-100)2+,+(110-100)2]≈228.5714.
2
∵x1=x2,s1
2 ∴甲车间产品定稳.2 2.1.5两个变量的线性相关 1、概念: (1)回归直线方程 (2)回归系数 2.最小二乘法 3.直线回归方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即变自量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到 个体Y值的容许区间。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。 如已经得到了空气中 NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空中气NO2的浓度。 4.应用直线回归的注意项事 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。 5.回归直线方程的推导 设x与y是具有线性相关关系的两个变量,且相应于样本的一组观测值的n个点的坐标分别是: (x,y),(x,y),(x,y),,(x,y),下面给出回归方程的推。 导 112233nn 设所求的回归方程为y? bxa,其中a,b是待确定的参数,那么: y? ibxia,(i1,23,,n), 样本中各个点的偏差是 yy? y(bxa),(i12,3, 显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分, 个点与回归直线在 (y 1 整体上的接近程度,而是采用n个偏差的平方和Q来表示n个点与相应直线(回归直线)在整体上的接近程度。 n 2 (yy? ) ii i1 n 2 (ybxa) bxa)(ybxa)(ybxa)(ynbxn 2 a) 求出当Q取最小值时的a,b的值,就求出了回归方程。 先证明两个在变形中用到的公式: 公式 (1) (x i i1 2 x) n 2 xnx i i1 其中 (x i x) (x 1 2 x)(xx) 2 公式(2) (xx xx 12 (x n 2 x) 2nx nx 2 xn)2nx nx 2 (x 1 2 xn)nx= nx 所以 (x x) nx n (xx)(yy) (x i i1因为 (1122 xyxy [(x 1 x)(yy) (x 1 n[ (x 1 nxy x)(y 1 y) (x 2 x)(y 2 y) (xx)(yy) nn x)y n nxy )x]nxy y) n x]nxy xynxyii i1 xy2nxynxyxynxy(xx)(yy) iiiiii i1=i1所以i1 Q的表达式的各项先展开,再合并、变形 Q(ybxa) 11 (ybxa)(ybxa) 2233 (ynbxna) (yyy)[2y(bxa)2y(bxa) 12n1122 n 2 na 2y(bxa)] nn 展开 a)(bx2 2b 2na( a) 2a a)] 2ab 2b na a,b为同类项,合并 --以a,b的次数为标准整理 i1 nanaybx 2() 2 xb 2 2 i xyy- 将数据转化为平均数x,y 2 iii n 2bxyii i1 n 2222 n[a(ybx)]n(ybx)bx i i1 2 -配方法 2 2 n[a(ybx)]ny2nbxy 2 222 nbxbx2b ii i1i1 展开 n[a bx)] 2 nx)2b(xy ii i1 nxy)( 2 yny)i 整理 n[a bx)] n[a bx)] (x i x) 2b (x i x)(y i y) 2y) (x i x)(y i y) 用公式 (一) -配方 2 x)[b 2b (x i 2x) 2y) (xx)(yy) ii i12 ] n 2i1 (xx) i i1 [(xx)(yy)] ii i1 n (xx) ii1 在上式中,共有四项,后两项与 a,b无关,为常数;前两项是两个非负数的和,因此要使得 Q区的最 小值,当且仅当前两项的值都为0。 所以 aybx n (xx)(yy) aybx n xynxy 2 (xx) i i1 ii i1n b2 x i 配方法,有两次配方,分别是 上述推倒过程是围绕着待定参数 a,b进行的,只含有 用公式 (一)、 (二)变形得 nx x,y的部分是常数或系数,用到的方法有( ii b的二次三项式; (2)变形时,用到公式 (一) 整体思想;(3)用平方的非负性求最小值。 (4)实际计算时,通常是分步计算: 先求出 x,y,再分别计算 n (xx)(y ii i1 y), nn 2 (xx)或xiyi i i1i1 nxy, n x2nx的值,最后就可以计算出i a,b的值。 6.相关系数r 统计中常用相关系数 r来衡量两个变量之间的线性相关的强弱,当 x不全为零,yi也不全为零时,则两个 i 变量的相关系数的计算公式是: n (xx)(yy) ii i1 r nn 22 (x i i1 x)(y i i1 y) xnxi i1 ynyi i1 2 r就叫做变量 y与x的相关系数(简称相关系数) 例1测得某国10对父子身高(单位: 英寸)如下: (1)对变量y与x进行相关性检验; (2)如果y与x之间具有线性相关关系,求回归直线方程; (3)如果父亲的身高为73英寸,估计儿子身高. 10102 解: (1)x66.8,y67,22x446224 x44794,y44929.22,xy4475.6,x. ii y4489, xy44836.4, ii i1 10 xynxy iii1 所以r 2 10n 2 22 xnxyny iii1 i1 2.1.7104475.6 (4479444622.4)(44929.2244890) 6. 80.4 82.4 6730.152 0.98, 所以y与x之间具有线性相关关系. 10 2)设回归直线方程为 bx,则 i 1 10 10xy44836.444756 0.4685, 4479444622.4 2 10x aybx670.468566.8 35.7042. 故所求的回归直线方程为 y0.4685x35.7042 3)当x73英寸时, y0.46857335.704269.9047, 所以当父亲身高为 73英寸时,估计儿子的身高约为 69.9 英寸. 析、预测,由一个变量的变化可以推测出另一个变量的变化.这是此类问题常见题型. 点评: 回归直线是对两个变量线性相关关系的定量描述,利用回归直线,可以对一些实际问题进行分 例2 10名同学在高一和高二的数学成绩如下表: 747172 767571 68 70 76 76 7367 7965 70 77 65 62 74 72 其中x为高一数学成绩,y为高二数学成绩. (1)y与x是否具有相关关系; 2)如果y与x是相关关系,求回归直线方程. 解: (1)由已知表格中的数据,利用计算器进行计算得 10 50520,y52541. i i1 10 xy10xy 1ii1 r 102102 22 x10xy10y 514677172.310 222.1.8. 22 (505201071)(525411072.3) r0.78,由0.780.75知,有很大的把握认为x与y之间具有线性相关关系. 2)y与x具有线性相关关系,设回归直线方程为yabx,则 10 7. xy10xy bi514671071 72.3 1 102 2 2 505201071 x10x i i1 所以y关于x的回归直线方程为y1.22x14.32. 10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 高中 必修 三统 知识点 整理 0607191608