完整版统计学考试.docx
- 文档编号:3109064
- 上传时间:2022-11-17
- 格式:DOCX
- 页数:13
- 大小:459.02KB
完整版统计学考试.docx
《完整版统计学考试.docx》由会员分享,可在线阅读,更多相关《完整版统计学考试.docx(13页珍藏版)》请在冰豆网上搜索。
完整版统计学考试
一、名词解释
1、SAS永久性数据集:
存放于本地硬盘的SAS数据集,SAS系统关闭,数据集仍然保存。
2、SAS临时性数据集:
放在SASwork目录中的数据集,SAS系统关闭,自动删除。
3、SAS程序的编写初步包括数据步、过程步。
数据步:
由一个或几个语句组成,作用是输入数据并建立SAS数据集。
过程步:
由一个或几个语句组成,作用是对已形成的SAS数据集通过调用现成的SAS过程进行统计分析、打印等处理。
4、检验功效:
指当两总体参数确有差别时,按α水准,假设检验能发现它们有差别的能力。
5、中位生存时间:
刚好有50%个体的存活期大于该时间。
二、填空题
1、SAS窗口包括编辑器窗口、日志窗口、结果输出窗口、资源管理器窗口、结果窗口。
2、SAS系统全称StatisticsAnalysisSystem。
3、SAS过程包括数据步、过程步。
4、用SAS进行基本描述,有2个基本函数:
Procmeans、Procunivariate。
5、纵向合并用set语句;横向合并用MERGE语句。
6、在inputcards语句中,如果录入字符变量,则在变量后加‘$’符号,如果是横行录入则加‘@@’符号;
7、SAS运算符**表示乘方。
8、实验设计三要素:
受试对象、处理因素、实验效应。
9、实验设计基本原则:
对照、重复、随机化。
10.方差分析用ProcANOVA模块
非参数分析用Procnparlway模块
卡方分析用Procfreq模块
线性回归用ProcReg模块
11、SAS计算样本量用Procpower模块。
三、统计分析题
t检验及t’检验
例1、为研究人尾加压素Ⅱ与高血压的关联性,某研究者做了预实验,在某个社区抽取年龄在40~60岁的10名高血压患者和10名正常血压者,用ELISA法检测病例和对照血清中的人尾加压素Ⅱ的水平,得数据如下表。
试比较高血压组和正常血压组人尾加压素Ⅱ水平是否有差别?
表110名高血压患者和10名正常血压者的人尾加压素Ⅱ水平(ng/ml)
高血压组
正常血压组
0.72
0.83
0.67
0.79
0.66
0.71
0.51
0.82
1.08
0.54
1.14
0.70
0.87
1.04
0.74
0.64
0.85
0.89
0.90
0.85
1、正态性检验TestsforNormality
n<50用W检验
n≥50用D检验
答:
本例n<50,用W检验,两组P值分别为0.8007和0.9737均>0.10,故认为两变量X符合正态分布。
2、方差齐性EqualityofVariances
F=1.92,P=0.3461,按α=0.10水准,方差齐,故按照t检验。
方差不齐按照t’检验
齐看Equal
(考试为不齐)不齐看Unequal
3、t检验结果:
t=0.44,p=0.6685,按α=0.05水准,不拒绝H0,两组样本均数差异无统计学意义。
(考试看UnequalP<0.05有统计学意义)
方差分析ANOVA
例2为研究母亲在妊娠期间的吸烟状态与婴儿出生体重的关系,国外有研究人员记录了在医院产前门诊所记录的母亲的吸烟状态,并跟踪记录了相应的婴儿的出生体重,根据吸烟情况,母亲被分为四组,分别为母亲是不吸烟者(group=1);母亲是戒烟者,孕前某段时间抽烟(group=2);母亲是吸烟者,每日吸烟少于1包(group=3);母亲是吸烟者,每日吸烟大于等于1包(group=4)。
每组出生的体重数据如下。
表2母亲不同吸烟状态下婴儿出生体重(kg)
group=1
group=2
group=3
group=4
3.4
2.6
2.7
2.8
2.8
3.3
2.8
3.1
3.1
3.7
2.6
2.6
3.4
3.2
2.1
2.2
4.2
3.5
3.8
2.8
3.8
3.3
3.3
3.2
3.5
3.4
2.8
2.6
3.3
3
2.7
2.5
3.6
3.1
2.9
3.2
3.2
2.6
3.7
答:
(1)正态性检验TestsforNormality当n值不是很大时,一般n<50,用W检验,本例W检验结果,四组P值均>0.10,故认为四组变量X符合正态分布。
(2)方差齐性(Levene’sTestforHomogeneityofxvariance向下找)检验结果为:
F=0.51,P=0.6808,按α=0.10水准,方差齐,满足方差分析的前提条件。
(3)方差分析结果:
F=8.29,p=0.0003,按α=0.05水准,拒绝H0,接受H1,四个总体均数不全等或全不等。
卡方检验
例3某医生观察冠心软胶囊治疗冠心病心绞痛的临床疗效。
用冠心软胶囊(治疗组)与复方丹参片(对照组)作对比治疗,以临床症状及心电图疗效等为观察指标。
所有冠心病心绞痛患者均为门诊患者,均符合世界卫生组织(WHO)制定的《缺血性心脏病的命名及诊断标准》,将患者随机分为两组,其中患者性别、年龄、病情、病程等在两组间是均衡的,两组病人临床症状改善效果见下表。
试比较两种药物治疗冠心病心绞痛的总体有效率有无差别?
表3 两组药物治疗心绞痛疗效的比较
组别
有效人数
无效人数
合计
有效率(%)
治疗组
32(28.64)
3(6.36)
35
91.43
对照组
13(16.36)
7(3.64)
20
65.00
合计
45
10
55
80.82
条件:
N>=40且T>=5看Chi-Square
N>=40且1= 该资料为定性资料,采用卡方检验。 建立假设检验 H0: 两种药物治疗冠心病心绞痛的总体有效率无差异,π1=π2。 H1: 两种药物治疗冠心病心绞痛的总体有效率有差异,π1≠π2。 α=0.05。 因本例n>40,且有一个格子的理论频数<5,需要用校正公式计算卡方值。 F=4.3313,P=0.0374,P<0.05,按α=0.05水准,拒绝H0,可以认为两种药物治疗冠心病心绞痛的临床疗效不同,可以认为冠心软胶囊治疗冠心病心绞痛的临床疗效比复方丹参片好。 等级资料的比较(单项有序) 用非参统计 Procnpar1way; 例4某研究者对肝舒贴穴位敷贴治疗肝癌肝区疼痛的临床疗效进行观察,将60例肝癌病人随机分成两组,治疗组用肝舒贴穴位敷贴,对照组应用常规治疗。 两组病人肝区疼痛缓解情况见下表 表4两种方法治疗肝癌患者肝区疼痛的效果 治疗方法 完全缓解 明显缓解 中度缓解 轻度缓解 无效 合计 肝舒贴 9 12 4 3 2 30 常规治疗 5 6 10 7 2 30 建立假设检验 H0: 两种治疗病人肝区疼痛缓解无差异。 H1: 两种治疗病人肝区疼痛缓解有差异。 双侧α=0.05。 当要比较完全随机化设计的两组资料为等级资料时,选用秩和检验,本例用Wilcoxon符号秩和检验检验,正态近似检验的结果为Z=-2.0630,双侧P=0.0391<0.05,差异有统计学意义,故两种治疗病人肝区疼痛缓解有差异。 秩次越高,效果越差,1组平均秩次25.97小于2组平均秩次的35.03,故1组效果比2组好。 该题可以用CMH方法计算行平均分检验统计量 程序中看(RowMeanScoresDiffer) Logistic回归 非线性概率型模型 Y为分类变量,协变量为分类或连续性变量 估计协变量与Y的关联用OR及95%CI,有wald卡方检验 下表是运动和吸烟与冠心病关系的病例对照研究结果,变量赋值为: 运动(: 运动=1,不运动=0)、吸烟(: 吸烟=1,不吸烟=0)、冠心病(: 有=1,无=0)。 本研究主要探讨运动与冠心病关系 表5运动和吸烟与冠心病关系的病例对照研究的资料整理表 分析如下表(需画表格): 生存分析 例19-5为从基因遗传角度探索某恶性肿瘤的预后,研究人员收集了69名患者的生存时间,生存结局及影响因素。 变量及其赋值见表19-7,实际资料见表19-8。 试采用Cox回归模型进行分析。 表19-7变量赋值表 变量名称 因素 量化值 X1 发病年龄 岁 X2 性别 1=男;0=女 X3 有无不良染色体 1: 有;0: 无 X4 基因1 1: 突变型;0: 野生型 X5 基因2 1: 突变型;0: 野生型 X6 基因3 1: 突变型;0: 野生型 Y 是否死亡 1: 死亡;0: 删失 t 生存时间 月 单因素Cox模型分析 表19-9单因素Cox模型分析结果 变量 参数(β) 标准误 似然比χ2 P值 RR 95%下限 95%下限 age -0.00938 0.01918 0.2392 0.6248 0.991 0.954 1.029 gender -1.63192 0.46016 12.5770 0.0004 0.196 0.079 0.482 chr -0.57123 0.36487 2.4511 0.1174 0.565 0.276 1.155 gene1 -1.82919 0.53845 11.5407 0.0007 0.161 0.056 0.461 gene2 0.70885 0.38484 3.3928 0.0655 2.032 0.956 4.319 gene3 0.28990 0.38616 0.5636 0.4528 1.336 0.627 2.848 多因素Cox模型分析 procphregdata=cancer; modelt*y(0)=agegenderchrgene1gene2gene3/risklimitsselection=stepwisesle=0.05sls=0.05; run; 针对研究目的列出相应统计量: genderP=0.0002<0.05RR=0.18395%可信区间0.074-0.452 gen2P=0.0328<0.05RR=2.28595%可信区间1.070-4.880 男性是女性风险的0.183倍,女性风险高。 gen2突变型比野生型死亡风险增加2.285倍。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 统计学 考试
![提示](https://static.bdocx.com/images/bang_tan.gif)