3资料的性质统计表与统计图Word格式文档下载.docx
- 文档编号:16166015
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:14
- 大小:2.32MB
3资料的性质统计表与统计图Word格式文档下载.docx
《3资料的性质统计表与统计图Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《3资料的性质统计表与统计图Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
二、资料性质:
n
传统划分法n
现代划分法
统计资料传统划分方法:
计量资料n计数资料n等级资料
计量资料:
又称定量资料或数值变量资料n
测定每个观察单位某项指标量的大小而获得的资料。
例如测得正常成年男子身高(cm)、体重(kg)、血红蛋白(g/L)n
其变量值是定量的,表现为数值大小,一般有度量衡单位
计数资料:
又称定性资料或无序分类变量资料n
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料n
其变量值是定性的,表现为互不相容的属性或类别n
分为二分类和多分类两种情形
等级资料n又称半定量资料或有序分类变量资料n
将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料n
其变量值具有半定量性质,表现为等级大小或属性程度
统计资料现代划分方法
计数资料
定量资料
计量资料
二值资料
定性资料多值名义资料
多值有序资料
定量资料:
测定每个观察单位某项指标量的大小n
指标的取值可以带度量衡单位,甚至可以带小数的定量资料。
例如测得正常成年男子身高(cm)、体重(kg)、血红蛋白(g/L)n
指标的取值可以带度量衡单位,只能取整数,通常为正整数。
例如测得正常成年男子脉搏数(次/min)、引体向上的次数(次/min)
定性资料:
观测每个观察单位某项指标质的状况n
二值资料:
观测值只有对立的两种结果n
多值名义资料:
指标质的不同状况之间在本质上无数量大小或先后顺序之分。
例如血型(A型、B型、AB型、O型)、职业(工人、农民、知识分子)n
多值有序资料:
指标质的不同状况(状态个数³
3)之间在本质上有数量大小或有先后顺序之分。
例如疗效(治愈、显效、好转、无效)
识别资料类型的要领n看从每一个体上测得的结果n看变量、取值及其专业含义
资料类型识别中常见错误:
将一切“百分比”或“百分率”资料视为定性资料n
将形式上的数字当作准确测量所得的数值,如用1和0分别表示阳性和阴性结果,然后对含有多个1和0的一串数进行各种运算,如求平均值和标准差
收集到某医院1994-1997年送检的血管瘤手术标本存档蜡块107例。
其中毛细血管瘤45例……正常小儿皮肤对照6例。
高倍镜下每例肿瘤区内计数500个细胞,计数雌激素受体和孕激素受体阳性细胞的百分率。
数据如表2所
错误辨析:
n高倍镜下每例肿瘤区内计数500个细胞,计数ER和PR阳性细胞的百分率,从每一个个体的标本上都可以测得1个ER阳性细胞百分率和1个PR阳性细胞百分率,这两个百分率都是表现为量的大小,故ER百分率和PR百分率两个结果变量都是定量的
各类资料间的转化n
在资料分析过程中根据需要在有关专业理论指导下,各类资料间可以相互转化n
将定量资料转化为定性资料较为容易,在研究设计时,对于能测量的指标应尽可能设计为定量指标
三、统计表n
定义:
表达统计分析结果的表格称为统计表。
凡是由“文字、数字、线条”等组合而成的信息集合,都可统称为统计表n
作用:
展示统计数据的结构、分布和主要特征。
它可以避免冗长的文字叙述,使要表达的内容中心突出、简单明了,便于直观分析和比较
标题:
相当于文章的题目,位于统计表的上方中央。
应当提纲挈领、中心突出。
必要时需注明资料的地点和时间n
标目:
可分为横标目、纵标目,必要时需给出总的纵标目。
横标目与纵标目分别说明每行与每列数字的含义。
总的纵标目则常常是关于表体中数据的专业含义的解释性术语
线条:
最基本的线有三条,即顶线、底线以及纵标目与表体之间的分割线。
顶线和底线一般采用较粗的横线(如1.5磅),其它线则采用常规线条(0.5磅)n
当同时存在纵标目与总纵标目时,二者之间可用一条辅线隔开。
各组数字与“合计”数字之间也要有辅线隔开n
统计表内不能有竖线
数字:
用阿拉伯数字表示。
表内一般不留空格。
若数字为零用“0”表示,无数字用“-”表示,缺失值用“…”表示n
备注:
不是统计表的必要构成成分,表中数字区不要插入文字,也不列备注项。
必须说明者标“﹡”号,在表下方说明
统计表的编制原则n
简单明了。
一张统计表最好只表达一个中心内容,不要很多内容堆在一起n
分组标志清晰。
一般情况下,把统计表的“原因变量”放在表的左侧,作为横标目;
把统计表的“结果变量”放在表的右上侧,作为纵标目
统计表的分类n
根据统计表中所包含分组变量的个数分为:
简单表、复合表n根据表中所表达的资料的性质分为:
频数分布表、简化形式的定量资料统计表、列联表
频数分布表n
将变量值划分为若干个组段,清点并记录各组段变量值的个数,绘制成统计表,称为频数表
编制频数表的步骤
1.求极差:
也称全距(Range)R=最大值-最小值=5.71-2.35=3.36
2.确定组段数(取10-15组)和组距:
组距(i)=全距∕组段数=3.36∕10=0.336≈0.30
3.写出组段:
起始组段取小于或等于最小值的数,最后组段包含最大值
4.分组划计并统计频数
频数表的用途
1.描述频数分布的类型对称分布正(右)偏态分布、负(左)偏态分布
2.描述频数分布特征变异范围、统计分布规律(对称性、集中位置、在各组段出现的频率等)
3.便于发现资料中的可疑值
4.便于进一步做统计分析和处理
简化形式的定量资料统计表n
实验研究中,往往需要按照原因(称为因素)的多种状态(称为水平)进行分组实验,而每组中又往往包含多个受试对象,从每个受试对象个体上均可获得某定量观测指标的具体数值n
在进行统计分析时,需要用到所有的数据,而在资料表达时,为节省版面,则只能给出各组的均值和标准差,即只能给出简化形式的定量资料统计表
统计表常见错误辨析n
线条过多n
纵横标目颠倒n
同一张表中的内容过多n
数据含义不清
四、统计图n
统计图是表达统计资料很重要的方式之一。
它用“点、线、面、体”等几何元素组合成图形,形象生动地表达事物或现象的数量大小或变化趋势
(图略)
统计图的种类n
表达离散资料的统计图有单式条图、复式条图、百分条图、构成图、圆图等n
表达连续资料的统计图有盒须图、直方图、多边图、散点图、线图等n
表达事物或现象在区域或空间上分布情况的统计图有统计地图、曲面图等
统计图的绘制要领n
要根据资料的性质选用相应的统计图n
要确保坐标轴上所标的刻度符合数学原则,如果采用的是普通算术尺度,同一个坐标轴上等长的线段所代表的数量应该相等
如果实际资料不是从“0”开始,通常最小的数值比“0”大很多,此时,在坐标轴上标刻度可采取两种补救的办法:
其一,在坐标原点“0”与最小值之间画“//”将其断开,表明其间省略了一块区域;
其二,用一个矩形将图形部分圈起来,表明它是一个“图域”,而不是一个严格的直角坐标系
条图n
用若干个细长的矩形条的高度来表达各组数量大小的图形n
应用场合:
适合用来表达定性变量各水平组中的数量大小。
这种定性变量通常是名义变量,即对各组在横轴上被放置的前后顺序没有严格要求
条图分类n
单式条图:
横轴上只有一个定性变量,图中有多少个长条,就表明该定性变量有多少个水平n
复式条图:
横轴上有两个或多个定性变量,图中有多少个长条,就表明这些定性变量有多少种水平组合
百分条图n(以下图略)
将一个长条的总长度视为100%,根据整体中各部分所占的百分比,将它们依次在长条上表示出来,称为百分条图
n应用场合:
百分条图通常反映局部与整体之间的关系,要求各项之间彼此是有联系的,且各项百分数之和为100%
圆图n
是百分条图的另一种表现形式,是用圆的各扇面的面积(严格地说,是依据圆心角的大小)来表示各组数量的大小n
通常用于反映局部与整体之间的数量关系,因此,通常用相对数作为统计指标来绘制圆图,而且,要求各组之合计必须为100%。
绘图时,所用的观测指标必须是相对数
箱式图或盒须图n
适于粗略表达一组定量资料的分布情况,特别是多组数据分布的比较n它将全部数据中居中的50%的数据所在的范围用一个长方形表示出来,较小和较大的数据所在的范围将各用一根线表示出来
直方图n
适用于表达一组定量资料的频数分布情况n
把用频数分布表表达的资料用图形方式显示出来,使各组段上的频数分布情况一目了然
它是用各组段上小长方形的面积来表示频数。
因此,绘图时,纵轴上数据的单位应理解为(1/组距)。
这样一来,各组段上以“1/组距”为单位的频数乘以组距,在数值上正好等于该组段上的频数。
既保证了绘图上的方便,又保证了直方图用“面积”表示频数的要求
散点图n
也叫散布图。
适用于表达两个在专业上有联系的定量指标同时变化的趋势n如测定了一组正常成年男子的身高和体重数据,就可以通过绘制散布图来了解这两个定量指标之间是否存在某种关系(直线趋势、曲线趋势或无关)
线图n
设(ti,yi)代表某种事物或现象在时刻ti的取值为yi,则将各点按时间先后顺序依次用线段连接起来,所形成的折线就称为线图n
适于表达某种事物或现象随时间推移的变化幅度和速度
线图分类n
普通线图:
纵、横轴上都使用算术尺度的线图,称为普通线图,简称线图。
它实际上反映的是事物或现象随时间推移的变化幅度,即一组数据中最大值与最小值之差量n
半对数线图:
纵、横轴上有一个使用算术尺度、另一个使用对数尺度的线图,称为半对数线图。
它实际上反映的是事物或现象随时间推移的变化速度,即一组数据中最大值与最小值之商
应用线图的注意事项n
当图中有两条或多条折线时,通常人们关心的是哪一条折线随着时间的推移,变化得快一些。
因此,为了使图形反映的情况与人们期望得到的结果相吻合,当图中有两条或多条折线时,绘制半对数线图为宜
P-P图和Q-Q图n
P-P图(Probability-probabilityplot):
将定量指标的观测值按由小到大的顺序排列,然后计算其实际累积频率,以实际累积频率对被检验分布(例如正态分布)的理论累积频率作图,称为P-P图。
若原资料确实服从假定的概率分布,那么,图形大体上将呈直线
Q-Q图(Quantile-Quantileplot):
将定量指标的观测值按由小到大的顺序排列,以实际观测值对被检验分布(例如正态分布)的理论分位数作图,称为Q-Q图。
统计图常见错误n
用最简单的条图表达各种各样的资料,尤其是运用条图表达连续性资料,这就割裂了数据之间的内在联系
在坐标轴上随意标刻度,严重违背数学原则
误用复式条图表达适合用线图表达的资料n
论文《硝苯地平对牙龈成纤维细胞增值和DNA合成的影响》中有下页所示统计图。
试辨析其错误
坐标轴违背数学原则n
某人用狗作为受试对象,研究不同处理条件下血钾浓度随时间推移的变化趋势,使用了普通线图,见图3-1。
请问:
此图绘制得正确吗?
n解析:
图3-1中A-D代表4条狗。
这幅图在纵、横轴上标的刻度是违反数学原则的!
在纵轴
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 性质 统计表 统计图
![提示](https://static.bdocx.com/images/bang_tan.gif)