数据的收集与整理.docx
- 文档编号:3552340
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:17
- 大小:201.63KB
数据的收集与整理.docx
《数据的收集与整理.docx》由会员分享,可在线阅读,更多相关《数据的收集与整理.docx(17页珍藏版)》请在冰豆网上搜索。
数据的收集与整理
一、知识网络
1、数据处理的基本过程是:
⑴(全面调查、抽样调查);
⑵(画出统计表、统计图);
⑶(根据统计表、统计图进行描述);
⑷(分析原因、得出结论、作出判断)。
知识点一:
总体、样本的概念
1、总体和样本
总体:
要考查的对象称为总体。
个体:
组成总体的每一个考察对象称为个体。
样本:
从当中抽出的所有实际被调查的对象组成一个样本。
样本容量:
样本中叫样本容量(不带单位)。
如:
要了解某校全体学生早晨用餐情况,抽出其中三个班做调查。
总体是;样本是;个体是。
综合练习:
1、为了了解某县七年级2000名学生的身高,从中抽取500名学生进行测量,对这个问题,下面说法正确的是()
A、2000名学生是总体B、每个学生是个体
C、抽取500名学生是所抽的一个样本D、每个学生的身高是个体
1:
为了了解2009年北京市中考数学考试情况,从所有考生中抽取600名考生的成绩进行考查,指出该考查中的总体和样本分别是什么?
举一反三:
1.2007年某县共有4591人参加中考,为了考查这4591名学生的外语成绩,从中抽取了80名学生成绩进行调查,以下说法不正确的是().
A.4591名学生的外语成绩是总体; B.此题是抽样调查;
C.样本是80名学生的外语成绩; D.样本是被调查的80名学生.
2.为了了解某校七年级400名学生的期中数学成绩的情况,从中抽取了50名学生的数学成绩进行分析。
在这个问题中,
总体是,个体是,
样本是,样本容量是.
3、为了解一批白炽灯的寿命,从中抽取了20只白炽灯进行试验,这个问题的样本是()
A、抽取的20只白炽灯 B、抽取的20只白炽灯的寿命
C、这批白炽灯的寿命D、20
知识点二:
全面调查与抽样调查
调查的方式有两种:
和:
1.全面调查:
考察全面对象的调查叫全面调查.全面调查也称作普查,调查的方法有:
问卷调查、访问调查、电话调查等.
全面调查的步骤:
(1)收集数据;
(2)整理数据(划记法);
(3)描述数据(条形图或扇形图等).
2.抽样调查:
若调查时因考察对象牵扯面较广,调查范围大,不宜采用全面调查,因此,采用抽样调查.抽样调查只抽取一部分对象进行调查,然后根据调查数据推断全体对象的情况.
抽样调查的意义:
(1)减少统计的工作量;
(2)抽样调查是实际工作中应用非常广泛的一种调查方式,它是总体中抽取样本进行调查,根据样本来估计总体的一种调查.
3.全面调查收集到的数据全面、准确,但一般花费多、耗时长,而且某些具有破坏性的调查不宜用全面调查;
抽样调查花费少、时间短,节省人力、物力、财力,破坏性小;结果往往不如全面调查准确,且样本选取不当,会增大估计总体的误差。
抽样调查的要求是:
(1)每个个体被抽到的机会相同;
(2)样本容量要适当。
2:
下列调查中,适合用普查(全面调查)方法的是().
A.电视机厂要了解一批显像管的使用寿命;
B.要了解我市居民的环保意识;
C.要了解我市“阳山水蜜桃”的甜度和含水量;
D.要了解某校数学教师的年龄状况.
练习:
1、下列调查中,调查方式选择正确的是()
(A)了解100个灯泡的使用寿命,选择全面调查
(B)了解某公园全年的游客流量,选择抽样调查
(C)了解生产的50枚炮弹的杀伤半径,选择全面调查
(D)了解一批袋装食品是否含有防腐剂,选择全面调查
2、为了解某校学生的每日运动量,收集数据比较合理的是()
A调查该校舞蹈队学生每日的运动量 B调查该校书法小组学生每日的运动量
C调查该校田径队学生每日的运动量 D调查该校某一班级学生每日的运动量
3、为了解所在地区的科学素养状况,分别作了四种不同的抽样调查,下列调查中,你认为抽样比较合理的是()
A、调查200名该地区的在校学生的科学素养状况。
B、在科技馆调查200名该地区参观者的科学素养状况。
C、调查5名该地区居民的科学素养状况。
D、将本地区所有居民随机编号,抽取末位数字为5的该地区居民,调查他们的科学素养状况。
4、为了作好三项调查:
①了解导弹的杀伤威力;②检查一架载人航天飞机各部件的性能指标;③对某市的中考数学试卷每道小题的得分情况进行分析。
其中适合抽样调查的个数是()
A、0B、1C、2D、3
5.下列调查适合全面调查的是().
(A)调查2009年6月份市场上某品牌饮料的质量
(B)了解中央电视台直播北京奥运会开幕式的全国收视率情况
(C)环保部门调查5月份黄河某段水域的水质情况
(D)了解全班同学本周末参加社区活动的时间
知识点三:
扇形统计图和条形统计图及其特点
1、数据的表示方法有列表和画统计图两种。
列统计表表示数据、整理数据,能通过统计表计算出总体或各项目的数目等;各项目的百分比之和为,统计图分有统计图、统计图和统计图三类。
三种统计图的优点和不足
统计图
优点
不足
条形
统计图
能清楚地表示出每个项目的数据的个数
不能准确地描述各项目各个数据之间的关系
折线
统计图
能清楚地反映事物的变化趋势
不能反映每个数据在每个项目中的具体情况
扇形
统计图
能清楚地表示出各部分在总体中所占的百分比
不能从统计图上看出每个项目的数据的个数
(3)扇形统计图的优缺点:
扇形统计图的优点是易于显示每组数据相对于总数的大小,缺点是在不知道总体数量的条件下,无法知道每组数据的具体数量.
2.用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫做条形统计图.
(1)条形统计图的特点:
①能够显示每组中的具体数据;
②易于比较数据之间的差别.
(2)条形统计图的优缺点:
条形统计图的优点是能够显示每组中的具体数据,易于比较数据之间的差别,缺点是无法显示每组数据占总体的百分比.
练习:
1、在扇形统计图中,其中一个扇形的圆心角是216°,则这个扇形所表示的部分占总体的百分数是.
2.在总体为1000人的扇形图中,表示某部分的扇形圆心角为
,则该部分的人数约为人,若表示某部分的人占总体的
,则表示该部分的扇形的圆心角是.
4.如图是某班学生最喜欢的球类活动人数统计图,则下列说法不正确的是().
(A)该班喜欢乒乓球的学生最多
(B)该班喜欢排球与篮球的学生一样多
(C)该班喜欢足球的人数是喜欢排球人数的1.25倍
(D)该班喜欢其他球类活动的人数为5人
5、某校八年级
(1)班为了了解同学们一天零花钱的消费情况,对本班同学开展了调查,将同学一周的零花钱以2元为组距,绘制如图的频率分布直方图,已知从左到右各组的频数之比为2∶3∶4∶2∶1.
(1)若该班有48人,则零花钱用最多的是第组,有人;
(2)零花钱在8元以上的共有人;
(3)若每组的平均消费按最大值计算,则该班同学的日平均消费额
是元(精确到0.1元)
6.学期结束前,学校想调查学生对七年级数学人教版实验教材的意见,特向七年级300名学生进行问卷调查.其结果如下:
非常喜欢的有150人,喜欢的有100人,有一些喜欢的有42人,不喜欢的有8人.
(1)计算出每种意见的人数占调查人数的百分比
(2)作出反映调查结果的扇形统计图
(3)从条形统计图上你能得出什么结论?
说说你的理由.
条形统计图与扇形统计图结合:
1:
某厂生产一种产品,图一是该厂第一季度三个月产量的统计图,图二是这三个月的产量占第一季度总量的比例分布统计图,统计员在制作图一、图二时漏填了部分数据.
根据上述信息,回答下列问题:
(1)该厂第一季度哪一个月的产量最高?
__________月.
(2)该厂一月份产量占第一季度总产量的__________%.
(3)该厂质检科从第一季度的产品中随机抽样,抽检结果发现样品的合格率为98%.请你估计:
该厂第一季度大约生产了多少件合格的产品?
(写出解答过程)
2.卫生部修订的《公共场所卫生管理条例实施细则》从今年5月1日开始正式实施,这意味着“室内公共场所禁止吸烟”新规正式生效.为配合该项新规的落实,某校组织了部分同学在“城阳社区”开展了“你最支持哪种戒烟方式”的问卷调查,并将调查结果整理后分别制成了如图所示的扇形统计图和条形统计图,但均不完整.
请你根据统计图解答下列问题:
(1)这次调查中同学们一共调查了多少人?
(2)请你把两种统计图补充完整;
(3)求以上五种戒烟方式人数的众数.
3.根据第五次、第六次全国人口普查结果显示:
某市常住人口总数由第五次的400万人增加到第六次的450万人,常住人口的学历状况统计图如下(部分信息未给出):
解答下列问题:
(1)计算第六次人口普查小学学历的人数,并把条形统计图补充完整;
(2)第六次人口普查结果与第五次相比,该市常住人口中高中学历人数增长的百分比是多少?
4.(本题满分8分)为迎接建党90周年,某校组织了以“党在我心中”为主题的电子小报制作比赛,评分结果只有60,70,80,90,100五种.现从中随机抽取部分作品,对其份数及成绩进行整理,制成如下两幅不完整的统计图.
根据以上信息,解答下列问题:
(1)求本次抽取了多少份作品,并补全两幅统计图;
(2)已知该校收到参赛作品共900份,请估计该校学生比赛成绩达到90分以上(含90分)的作品有多少份?
5、(2011•陕西)某校有三个年级,各年级的人数分别为七年级600人,八年级5
40人,九年级565人,学校为了解学生生活习惯是否符合低碳观念,在全校进行了一次问卷调查,若学生生活习惯符合低碳观念,则称其为“低碳族”;否则称其为“非低碳族”,经过统计,将全校的低碳族人数按照年级绘制成如下两幅统计图:
(1)根据图①、图②,计算八年级“低碳族”人数,并补全上面两个统计图;
(2)小丽依据图①、图②提供的信息通过计算认为,与其他两个年级相比,九年级的“低碳族”人数在本年级全体学生中所占的比例较大,你认为小丽的判断正确吗?
说明
理由.
6.(本题满分8分)
某生态示范园要对1号、2号、3号、4号四个新品种共500株果树幼苗进行成活实验,从中选出成活率高的品种进行推广.通过实验得知:
3号果树幼苗成活率为89.6%,把实验数据绘制成下列两幅统计图(部分信息未给出).
(1)实验所用的2号果树幼苗的数量是_______株;
(2)求出3号果树幼苗的成活数,并把图2的统计图补充完整;
(3)你认为应选哪一种果树幼苗进行推广?
请通过计算说明理由.
知识点四:
频数、频率和频数分布表
1.一般我们称落在不同小组中的数据个数为该组的频数,频数与数据总数的比为频率.频率反映了各组频数的大小在总数中所占的分量.
公式:
.
由以上公式还可得出两个变形公式:
(1)频数=频率×数据总数.
(2)
.
注意:
(1)所有频数之和一定等于总数;
(2)所有频率之和一定等于1.
2.数据的频数分布表反映了一组数据中的每个数据出现的频数,从而反映了在一组数据中各数据的分布情况.
1.在描述和整理数据时,往往可以把数据按照数据的范围进行分组,整理数据后可以得到频数分布表,在平面直角坐标系中,用横轴表示数据范围,纵轴表示各小组的频数,以各组的频数为高画出与这一组对应的矩形,得到频数分布直方图.
2.条形图和直方图的异同:
直方图是特殊的条形图,条形图和直方图都易于比较各数据之间的差别,能够显示每组中的具体数据和频率分布情况.
直方图与条形图不同,条形图是用长方形的高(纵置时)表示各类别(或组别)频数的多少,其宽度是固定的;直方图是用面积表示各组频数的多少(等距分组时可以用长方形的高表示频数),长方形的宽表示各组的组距,各长方形的高和宽都有意义.此外由于分组数据都有连续性,直方图的各长方形通常是连续排列,中间没有空隙,而条形图是分开排列,长方形之间有空隙.
4.频数分布直方图的画法:
(1)找到这一组数据的最大值和最小值;
(2)求出最大值与最小值的差;
(3)确定组距,分组;
(4)列出频数分布表;
(5)由频数分布表画出频数分布直方图.
注意:
(1)频数分布直方图以小长方形的面积来反映数据落在各个小组内频数的大小
(2)在频数分布直方图中,将每一个小长方形上面一条边的中点依次连接起来,这样得到的折线就是频数折线图.
5.画频数分布直方图的注意事项:
(1)分组时,不能出现数据中同一数据在两个组中的情况,为了避免,通常分组时,比题中要求数据单位多一位.例如:
题中数据要求到整数位,分组时要求数据到0.5即可.
(2)组距和组数的确定没有固定的标准,要凭借数据越多,分成的组数也就越多,当数据在100以内时,根据数据的多少通常分成5~12组.
绘折线统计图
例4、甲、乙两人在某公司做见习推销员,推销“小天鹅”洗衣机,他们在1-8月份的销售情况如下表所示:
月份/月
1
2
3
4
5
6
7
8
甲的销售量/台
7
8
6
7
6
6
7
7
乙的销售量/台
5
6
5
6
7
7
8
9
(1)绘制甲乙两人这8个月的月销售量的折线图(甲用实线,乙用虚线)
(2)根据作出的折线图,写出两条关于甲乙两人在这8个月的销售状况的信息。
通过直方图获取信息:
1、某青少年研究所随机调查了某校100名学生寒假中花费零花钱的数量(钱数取整数元),以便引导学生树立正确的消费观。
根据调查数据制成频数分布表和频数分布直方图。
(1)补全频数分布表和直方图;
(2)研究所认为,应对消费150元以上的学生提出勤俭节约的建议,试估计应对该校4000名学生中约多少名学生提出这项建议?
分组
频
数
所占
比例
0.5~50.5
③
0.1
50.5~①
20
0.2
100.5~150.5
④
⑤
②~200.5
30
0.3
200.5~250.5
10
0.1
250.5~300.5
5
0.05
合计
100
⑥
2、(8分)小龙在学校组织的社会调查活动中负责了解他所居住的小区450户居民的家庭收入情况.他从中随机调查了40户居民家庭收入情况(收入取整数,单位:
元),并绘制了如下的频数分布表和频数分布直方图.
分组
频数
百分比
600≤
<800
2
5%
800≤
<1000
6
15%
1000≤
<1200
45%
9
22.5%
1600≤
<1800
2
合计
40
100%
根据以上提供的信息,解答下列问题:
(1)补全频数分布表.
(2)补全频数分布直方图.(3)绘制相应的频数分布折线图.(4)请你估计该居民小区家庭属于中等收入(大于1000不足1600元)的大约有多少户?
3.某中学为了了解本校学生的身体发育情况,对同年龄的40名女学生的身高进行了测量,结果如下:
(数据均近似为正整数,单位cm)
167,154,159,166,169,159,156,162,158,159,160,164,160,157,161,158,153,158,164,158,163,158,x,157,162,159,165,157,151,146,151,160,165,158,163,162,154,149,168,164.
统计人员将上述数据整理后,画出了频数分布直方图,并列出了频数分布表如下:
身高(cm)
频数
144.5 2 149.5 A 154.5 14 159.5 B 164.5 6 合计 40 根据以上信息回答下列问题: (1)频数分布表中的A=_________,B=_________; (2)原始数据中,x的值可能是__________________. 绘制频数分布直方图与频数折线图 4、在一次抽样调查中收集了一些数据,对数据进行分组,绘制了下面的频数分布表: 分组 49.5~59.5 59.5~69.5 69.5~79.5 79.5~89.5 89.5~99.5 频数 9 15 16 12 (1)从表中可知,组数是,组距是. (2)第三小组(69.5~79.5)的频数是_______. 5、有若干个数据,最大值是124,最小值是103.用频数分布表描述这组数据时,若取组距为3,则应分为() A.6组B.7组C.8组D.9组 6、已知样本: 8,6,10,13,10,8,7,10,11,12,10,8,9,11,9,12,10,12,11,9.在列频数分布表时,如果取组距为2,那么应分成_______组;9.5~11.5这一组的频数是_______. 7、在对1200个数据进行整理的频数分布表中,各组的频数之和等于___,各组的频率之和等于__. 8、在1000个数据中,用适当的方法抽取50个为样本进行统计,频率分布表中54.5~57.5这一组的频率是0.12,那么估计总体数据在54.5~57.5之间的约有() A.120个B.60个C.12个D.6个 9.为了了解某中学九年级男同学的投掷标枪的成绩情况,从中抽测了20名男同学进行测验,其成绩如下: (单位: 米) 25.5 21.0 23.6 25.7 27.0 22.0 25.0 24.2 28.0 30.5 29.5 26.1 24.0 25.8 27.6 26.0 29.0 25.4 26.0 28.3 甲、乙两位同学分别根据以上数据进行了统计、绘图,下表与下图分别是甲、乙两位同学完成的一部分,表的划记栏中甲同学只统计了前3个同学的成绩,请你帮助他们完成表和图的剩余部分. 成绩(米) 划记 频数 百分比(%) 21.0≤x<23.0 - 23.0≤x<25.0 - 25.0≤x<27.0 - 27.0≤x<29.0 29.0≤x<31.0 合计 10.在同一条件下,对30辆同一型号的汽车进行耗油1升所行走路程的实验,得到如下数据(单位: 千米): 14.112.313.714.012.812.913.113.614.413.812.613.8 12.613.213.314.213.912.713.013.213.513.613.413.6 12.112.513.113.513.213.4 (1)这组数据的最小值是,最大值是,它们的差是。 (2)列出频数分布表,画出频数分布直方图和频数折线图. 11.2011年5月9日至14日,德州市共有35000余名学生参加中考体育测试,为了了解九年级男生立定跳远的成绩,从某校随机抽取了50名男生的测试成绩,根据测试评分标准,将他们的得分按优秀、良好、及格、不及格(分别用A、B、C、D表示)四个等级进行统计,并绘制成下面的扇形图和统计表: 等级 成绩(分) 频数(人数) 频率 A 90~100 19 0.38 B 75~89 m x C 60~74 n y D 60以下 3 0.06 合计 50 1.00 D C A A B40% 请你根据以上图表提供的信息,解答下列问题: (1)m=,n=,x=,y=; (2)在扇形图中,C等级所对应的圆心角是度; (3)如果该校九年级共有500名男生参加了立定跳远测试,那么请你估计这些男生成绩等级达到优秀和良好的共有多少人? 12、(2011•东营)果农老张进行桃树科学管理试验.把一片桃树林分成甲、乙两部分,甲地块用新技术管理,乙地块用老方法管理,管理成本相同.在甲、乙两地块上各随机选取40棵桃树,根据每棵树的产量把桃树划分成A,B,C,D,E五个等级(甲、乙两地块的桃树等级划分标准相同,每组数据包括左端点不包括右端点).画出统计图如下: (1)补齐直方图,求a的值及相应扇形的圆心角度数; (2)选择合适的统计量,比较甲乙两地块的产量水平.并说明试验结果; (3)若在甲地块随机抽查1棵桃树,求该桃树产量等级是B级的概率. 频数与频率: 为了了解中学生的体能状况,某校抽取了50名学生进行1min跳绳测试,将所得数据整理后分成5组,绘成了如图的频数分布直方图(图中数据含最低值不含最高值).已知前4个小组的频率依次为0.04,0.12,0.4,0.28.请完成下列问题. (1)第4组的频数是多少? (2)第五组的频率是多少? (3)哪一组的频数最大? (4)补全统计图,并绘出频数折线图. 综合题: 某中学在一次法律知识测试中,抽取了部分学生成绩(分数为整数,满分为100分),将所得数据整理后,画出频率分布直方图,已知图中从左到右的三个小组的频率分别是0.04,0.06,0.82,第二小组的频数为3. (1)本次测试中抽取的学生人数共有多少人? (2)分数在90.5~100.5这一组的频率是多少? 有多少人? (3)若这次成绩在80分以上为优秀,则优秀率为多少? 作业: 2.(2012福建福州,18,12分)省教育厅决定在全省中小学开展“关注校车、关爱学生”为主题的交通安全教育宣传周活动,某中学为了了解本校学生的上学方式,在全校范围内随机抽查了部分学生,将收集的数据绘制成如下两幅不完整的统计图(如图所示),请根据图中提供的信息,解答下列问题。 (1) _________%,这次共抽取__________名学生进行调查;并补全条形图; (2)在这次抽校调查中,采用哪种上学方式的人数最多? (3)如果该校共有1500名学生,请你估计该校骑自行车上学的学生约有多少名?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 收集 整理