9统计历年真题docWord格式.docx
- 文档编号:21512477
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:15
- 大小:49.66KB
9统计历年真题docWord格式.docx
《9统计历年真题docWord格式.docx》由会员分享,可在线阅读,更多相关《9统计历年真题docWord格式.docx(15页珍藏版)》请在冰豆网上搜索。
16.当原假设Ho客观上成立,但假设检验结果为以a水准拒绝H。
接受出。
这种统计学错谋称为:
_AJ
类错误
17.下列哪-指标小时,用样本均数估计总体均数的可靠性大?
C.
18.在假设检验中可能会犯两种错误.欲同时减少犯两类错误的概率J&
~C•增大样木呆
19.标准差可用于:
E.以上均町
20.Logistic回归分析,下列哪项不对?
D•应变量可以是分类变屋,也可以是数值变量
多选21.变异系数比较变异程度适宜:
C.同类指标,均数相祚较人E.不同指标,均数相淬较人
22.哪些是止态分布曲线特征:
B.标准澄为其变异度参数C.曲线丁•均数最高D.llll线下的面积有淀规律E.均数为其位置参数
23.均数的标准谋可用于C.佔计观察值的频数分布情况D.估计总体均数的町信区间
24.两样本均数比较t检验的应用条件冇A.两总体符合正太分布C.两总体方并相筹
E.两样本例数札1等
25.秩和检验与(检验比较优点是B.计算方法简便C.对数据耍求不严D.不受总体分布限制
26.在直线相关于冋归分析中,对于相关系数r和回归系数b的关系,下列哪些正确
B.为r>
0时,—淀冇b>
0D.^rVl时,•定冇b<
lE.r于b的假设检验等价
27.衣示某事物内部构成情况,可选用哪些统计图?
B」员1形图D.百分条图
28.比较两个人群的某总率时,哪些怙:
况应进行标准化?
B.两总率和同,内部构成不同
D.两总率不同,内部构成也不同E.两组人群的各分率间出现明显交义现象
29.关于t分布,论述正确有A.t分布是一簇以0为中心的对称的单峰曲线
B.半自山度趋向于8时,趋向于标准正态分布
30.假设检验,下列衣述正确B.冇统计意义时,不定冇实际意义C.拒绝H,可能犯第•类错谋
07选择
1.正态分布曲线下从U-1.6450到U+2.330所对应的面积,占正太分布|11|线下的总面积的:
C.94%
2•统计图横纵轴之比一般应为:
E.7:
5
3•四格表资料的卡方检验,在哪种情况下不需要采用确切概率法却需要校正法?
E」VT<
5.在检验假设的前提下卡方检验的基本思想为:
C.检验实际频数和理论频数的吻合程度
6•调査某单位糖球病患病情况,结果男职工2000人中冇20人患糖床病,女职工3000人中彳j40人患糖球病,则男女职工的糖球病总患病率为:
B.1.2%
7.2X2表资料,当不满足卡方检验的应用条件(各纽•的理论频数均小)时,最常用的处理方法:
&
对样本率进行总体的区间估计时,使用正态分布法的条件为:
A.nn^5且n(l-兀)$5
9.如果未知总体标准差,估计总体均数95%可信区间的公式:
A.X01.96s7
10•对于偏态分布的资料,a=0.05单侧正帘下限值为:
E.P5
11.理论上u分布曲线有_条曲线?
A.1
多选16•当原假设H0客观上成立,但假设结果为以a水准扎i•绝H0,接受H1.这种统计学错谋称为:
A.I类错误C.假阴性错误
17.下列哪一指标小时川样本均数估计总体均数的可靠性大?
C」0E.Q
1&
在假设检验中可能会犯两类错误,欲同时减少犯两类错误的概率应:
C.增大样本含最
19.标准差可用于A.表示一组观察值的离散程度B.计算变异系数C计算标准谋
20•配对计量资料的t检验的无效假设为E.差値的总体均数为0
06选择
1.医学统计学是研究医学现象数量和数量关系的一门_学科D.实用性科学
2•百分位数玖与中位数M的关系为D.P50=M
3.n<
30时,用样木均数來估计总体均数的99%可信区I'
可的公式—D.7。
如加/石
4•秩和检验主耍适用丁•C.样本來自任意分布或未知分布总体的资料比较
5•标准差是反应C.各观察值之间的差异
6.变异系数的主要用途C.均数相差悬殊或度量衡单位不同时比较儿种资料的变异度大
7•第二类错谋是指B.Ho不属实而被接受
在统计学意义上样本应是总体中D.冇代衣性的一部分
9•正态分布有两个参数曲线高度越低C.o越大
10•两变量相关回归分析中,相关系数r的检验结果是tr=4.04,则回归系数b的检验结果C.tb=4.04
11•对以I熨冋归直线方程对资料的要求是B.自变量是给定的数值,因变最是随机的
12•泊松分析与正态分布的关系D.P越人,泊松分布越逼近正态分布
13.7OXxxS7表示D.平均每100个样木(含量相同),冇95个样木得出该区间包括总体均数
14•应用公式(看不淸)2/T的条件是C.n>
401<
T<
15.完全随机设计的单因素方差分析,必然有C.SS尸SS側+SS组内
16•对于总体均属是否小于一个给定值的检验,该检验是A.单侧检验
17•用最小二乘法确定直线回归方程的原则是各观察点B.距直线的纵向距离的平方和最小
18,|r|>
r0.05(n-2)时,可认为两变量X与Y间A.冇一定关系
19•两个总体均数不相等,标准差相等则C.无法进行判断
20.川标准差比较两个同类总体平均数指标的代农性,基本前提:
D.两个总体的标准差应相等
多选
1・标准误町用于B.表示抽样误差大小C.佔计观察值的频数分布悄况
2.t分布曲线特点冇A.关于0点两侧对称C.曲线形态与自由度冇关E.当自由度无限増人,t分布趋近于标准止态分布
3.假设检验的-般步骤包括A.建立假设B.确定检验水准aC.选择单侧或双侧检验D.选择和计算检验统计量E.确定概率的判断结果
4•使用相对数注意A,计算相对数的分母不宜过小B.不要把构成比作率分析C.比较率的差别要有可比性E.样本率的比较应循环随机抽样原则
5•相关系数说明A.相关的方向B.相关的密切程度
05选择
1•欲比较两纽•单位不相同的资料的变异程度应选用下列哪利|指标D.CV
2•正态分布曲线F而积从均数加上-1.645到均数加上8。
占正太曲线下而积的B.95
3.以a=_时,第二型错误为最小A.0.2
4•以_小时,用样本均数估计总体均数的可靠性打C.S:
5•对于小样本资料,估计总体均数95%可信区间用哪个公式C.匚土如)5,Sx
6•在某山区小学随机抽収男生80人,其中帅吸虫感染23人,随机抽取女生85人,肺吸虫感染13人,欲知该山区男生和女生的肺吸虫感染率有无差别应进行C.u-test
7.在下列哪种情况下需耍用四格表矫正公式计算X2值B」<
5且N>
在分析一组资料特征时,除下列哪种指标外,其余指标单位都一样B方差
9•下列哪种指标在统计学中被称为把握度D.l-B
10•直方图可用于表示C.某现象的频数分布
11.行X列资料的X?
检验时若理论频数过小,最好解决方法是C正人样本含量
12某广告宣称-•种鞋梨有增高作用,说100名10岁女童用莫鞋址后一年内平均身高增长3cm,错误在丁B.米有对照组
13•设假设检验水准a=0.05,三个样本均数比较的方差分析计算结果为:
F=1.60,P>
0.05.结论正确的是D.不拒绝Ho,不能认为三个总体均数不同
14.成组设计两样本比较的秩和检验,如N]HN2则D.以n较小组的秩和为T
15.下列分布中的均数等于方差D.poissondistribution
16.某厂1996年底对全部800工人调查,结核病8人,1997年新增200人,97年底对全部工人调查后发现原8病人2人已治愈,老工人屮又发现3例新病人,新工人发现1例,该厂1997年患病率为:
A.1.0%
17.某学校男生300人,女生200人,HBsAg阳性率分别20%和10%,则全体学生总的HBsAg阳性率D.16%
18.反映某疾病发病例数随时间变化情况,应选用哪种统计图?
C.线图
19•欲反映恶性肿瘤对人群牛•命危害程度的人小通常采用下列哪种统计指标C.病死率
20•成组设计的方差分析中,必然有DSS尸SS组何+SS纽内
07填空
1.随机事件的发生概率介于0与1Z间
2.影响样本均数抽样谋差大小的因素是样本量人小和标准差•
3.医学统计资料的基本耍求有完整,正确和及时要有足够的数据资料的代表性和自比性
4.总体参数的区间估计时的两个特征粘确度和准确度
5.协方差分析的应用条件理论上要求观察变量服从正态分布,各观察变昴相互独立,各样木方差齐性和各总体客观存在线性回归关系且斜率相同(回归线平行)
6.在一定条件下七分布,二项分布,泊松等均趋向于正态分布
7.列举4种多元回归方程的假设检验方法
单因素方差分析时,总自由度是由V组内和V组何部分所组成的
06填空
1.说明离散程度的常用指标冇全能方并标准并变界萌数四分位间距
2.t检验的应用条件是已态分布N小总体方羌相筹
3.多元回归中R2的意义是Y的总变异中回归关系的能解释的百分比
4.直线回归分析中,总平方和可分解为回归平方和与剩余平方和,其中总平方和表示SS总总变异回归平方和表示在SS.H_剩余平方和表示SS*随机误差产生的变异
5.X2检验的用途有四格表行X列列联表
6.标准率越小,衣示抽样谋旁越小,样本和总体估计越可靠
7.两样木均数比较,差别有统计意义时,P越小,说明两者冇显善性差别
Fisher判别旌则是从方毅分析的观点,要求投彩点的类间方羌与类内方羌Z比最人
9.四个衣若冇理论数小于1或n小于40,宜用精确概率法进行假设检验
10.直线回归方程的一般表达式为y=a+bx
06名解
1.samplingerror:
抽样误差:
山抽样造成的样本统计量与总体参数之间差异或多样本统计量之间的差异
2.coefficientofvariation:
变界系数,cv,多用于观察指标单位不同时,实质上是一个相对变界指标,无单位,用观察单位P标准差与平均数Z比衣示
3.normaldistribution:
正态分布,随着观察例数逐渐增多,纽■段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线,称频数曲线,近似于数学上的正态分布。
4.第一类错误:
拒绝了实际上成立的Ho,即样木原木來自u=u0的总体,由于抽样的偶然性得到了较大的t值,较小的P值,按a=0.05检验水准拒绝了Ho,接受了H|,这类“弃真”错谋称为第一类错误。
5.假设检验:
hypothesistest,亦称显著性检验,其基本思想是先对总体的参数或分布做出某种假设,然后根据样本信息选用适当的方法,推断此假设应当拒绝或不拒绝。
05名解
2.rankedda仙等级资料又称定鼠资料,或冇序分类变最资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料
3.Naturalincreaserate:
H然增长率:
一定时间内种群自然增长数(出生数〉成长死亡数)与种群总数之比
4.paramctcr:
参数,描述总体变量值特征的指标
5.statisticalmodel:
统计模型,以数据统计分析为基础的变量关系u模型类型
7.chi-squaretest:
卡方检验,是一种用途很广的假设检验方法,它在分类资料统计推断中应用,包括两个率或两个构成比比较的卡方检验;
多个率或多个构成比比较U卡方检验及分析资料P相关分析等.
8.samplesize:
样本含量,样本中包含的观察单位数
9.Quartilcrange:
四分位数间距,是由第3四分位数和第1四分卫数相减而得,-•般和中位数一起描述偏态分布资料的分布特征
09名解
1.standarderror样木均数的标准差又叫标准误表示样木抽样误差的大小
3.rankcorrelation:
等级相关乂称秩相关是-•种非参数统计方法,适用于资料不是正态双变量或总体分布未知;
数据一端或两端有不确定值的资料或等级资料
4.confidenceinterval:
可信区间,是按一定的概率100(1-)%估计总体均数所在的范围,亦称估计区间。
常取的可信度为95%和99%。
5.variance方差川来度量随机变量和其数学期望(即均值)之间的偏离程度。
09简答
1.假设检验中如何确定采用单侧检验还是双侧检验?
答:
单双侧检验首先应根据专业知识來确定,同时也应考虑所要解决问题的目的.若从专业知识判断种方法的结果可能低于或禹于另一种方法的结果,则用单侧检验;
在尚不能用专业知识判断谁高谁低时,用双侧检验.若研究者对低丁-或高丁-两种结果都关心,则川双侧检验;
若仅关心之中-种可能,则取单侧检验.一般认为双侧检验较保守和稳妥,单侧检验山于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用.
2.简述配置设计方差分析的基本思想.
方差分析的基本思想就是根拥试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机谋差作用外,每个部分的变异可由某个因索的作用(或某儿个因索的交互作用)加以解释,如组间变异SS卸可山处理因索的作用加以解释.通过比较不同变异來源的均方,借助F分布做出统计推断,从而推论各种研究因索对试验结果有无影响.
方差分析的应用条件:
1•各样本是相互独立的随机样木,均服从正态分布;
2•相互比较的各样本的总体方差相等.即具有方差齐性.
3.神马是两类统计学错误?
二者有何联系?
正常情况下该怎么进行控制
两类统计学错误即I型错误和II型错误.1型错误是指拒绝了实际上成立的Ho所犯得”弃真”错谋,其概率大小用a表示.II型错误则是指”接受'
'
了实际上不成立的H。
所犯的”取伪”错误,莫概率大小用B表示.当样本含量n确定时,a愈小,0愈大,反之a愈大,B愈小.了解这两类错误的实际意义在于,若应川中耍重点减少a(如一般的假设检验),则収a=0.05;
若在应用屮重点减少B(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取a=0.10或0.20咲至更高.
4.简述绘制统计表的基本要求
答:
1•标题:
概括表的主耍内容,包括研究的时间.地点和研究内容,放在表的上方・2标目:
分别用横标hl和纵标目说明农格每行和每列数字的懣义,注意标明指标单位.3线条:
至少用三条线,农格的顶线和底线将表格与文章的其它部分分割开來,纵标H下横线将标H的文字区与表格的数字区分开來.部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开.其他横线竖线-•概省去.4数字:
用阿拉伯数字衣示.无数字用表示,缺失数字用表示,数值为0记为”0”,不要留空项.数字按小数位对齐.5表中数字区不要插入文字,也不列备注项.必须说明者标"
杯号,在表下方说明.
5.作两样本均数比较的t检验,结论拒绝Ho时,是否证明了两总体均数不同?
why?
06问答
1.可信区间和参考值范围有何不同?
意义、计算公式和用途均不同。
(1)参考值范围是指同质总体内包括TF分之几十个体值的估计范用。
而可信区间是指在百分之儿十的可信度估计的总体参数的所在范由。
(2)同样的百分之儿十,参考值范围是样本范围,可信区间是指可信度范用,二者有着本质的不同。
(3)从意义来看,95%参考值范由是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可售度估计的总体均数的所在范围。
(4)从计算公式看,若指标服从正态分布,95%参考值范围的公式是:
疋土1.96s。
总体均数95%可信区间的公式是:
"
士前者用标准差,后者用标准误。
前者用1.96,后者用a为0.05,自由度为v的t界值。
(5)从用途上看,可信区间用來佔计总体均数,参考值范帀用來判断观察对象的某项指标是否正常。
05问答
1.简述标准差•标准误的区别与联系?
标准差是描述标准个体值复界机度u指标,不能通过统计方法來控制,标准误则为样木均数u标准差,反应的是样本均数的离散程度,也反映了样本均数与总体均数u的差异.联系.S7=S/V^可看出SF与S差正比,增加n可减少S7
2.简述应用相对数时应注意哪些问题?
应用相对数时应注意:
1结构相对数不能代替强度相对数2汁算相对数应有足够数量3正确汁算合计率4注意资料的可比性5对比不同时期资料应注意客观条件是否相同6样本率(构成比)的抽样误差,不要简单比较,进行假设检验.
3.简述X?
检验的基本思想是神马?
是以X?
值的大小來反映理论频数与实际频数的吻合程度,徃假设Ho成立的条件下,实际频数与理论频数相差不应太大,即X2值不应太大,若实际计算出uX?
值越人,超过了设定的检验水准所对应u界值,叫有理山怀疑Ho的真实性,从而推论Ho确定巴
4.简述统计图制作要求有哪些?
1根据资料性质和分析丨1的正确选用适当P统计图2与统计农相似,统计图必须有标题,在图u下方3统计图一般有横轴和纵轴,比例为5:
7或7:
54统计图用不同颜色和线条表达不同爭物和对象的统计量.
5.简述检验假设与可信区间的联系与区别?
(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。
询者估计总体参数的大小,后者推断总体参数有无质的不同。
(2)可信区间也可回答假设检验的问题。
但可信区间不能提供确切的P值范鬧,只能给出在u水准上有无统计意义。
(3)可信区间还可提示差别有无实际意义。
6.简述直线相关与回归的区别与应用
区別:
(1)资料要求不同,和关要求两个变量是双变量正态分布;
冋归要求应变量Y服从正态分布,而1‘1变量X是能精确测量和严格控制的变量。
(2)统汁意义不同,相关反映两变量间的伴随关系这种关系是相互的,对等的;
不-•定有因果关系;
回归则反映两变量间的依存关系,有口变量与应变量之分,一般将'
因”或较易测定、变异较小者定为自变最。
这种依存关系可能是因果关系或从属关系。
(3)分析目的不同,相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出來;
冋归分析的目的则是把自变量与应变量间的关系用函数公式定量农达出來。
联系:
(1)变量间关系的方向-•致,对同一资料,Jtr与b的正负号一致。
(2)假设检验等价,対同一样本,tr=tb,由于%计算较复杂,实际中常以r的假设检验代替对b的检验。
(3)相关和回归可以相互解释,相关系数的平方r2(乂称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
(4)对于II型冋归,I■与b值可相互换算,刊札几。
7.举例说明Poissondistribution的特征与应用
特征1•总体均数与总体方差a2相等2.当n很大n很小,且n〒=X为常数时,二项分布近似poisson分布3.当入增大时poosson分布渐进.正态分布,入$0时,可作止态处理4.poisson分布具备可加性.应丿止1总体均数口区间估计2.样木均数与总体均数□比较3•两样本均数的比较.
用你所熟悉的专业举例说明方差分析的基本思想与工作步骤
07问答
1.假设检验中如何确定p值大小?
简述P值的含义/
P值的计算:
一般地,用X表示检验的统计量,当H0为真时,可由样本数据计算岀该统计量的值C,根据检验统il-ftx的具体分布,可求出P值。
具体地说:
左侧检验的P值为检验统il-ftx小于样本统计值C的概率,即:
P=P{X<
C}右侧检验的P值为检验统计量X大于样木统计值C的概率:
P=P{X>
C}双侧检验的P值为检验统计量X落在样本统计值C为端点的尾部区域内的概率的2倍:
P=2P{X>
C[(当C位于分布曲线的右端时)或P=2P{X<
C}(当C位于分布曲线的左端时)。
若X服从止态分布和t分布,其分布曲线是关于纵轴对称的,故其P值可表示为P=P{|X|>
C}o计算岀P值后,将给定的显著性水平a与P值比较,就可作出检验的结论:
如果a>
P值,则在显著性水平a下拒绝原假设。
如呆MP值,则在显著性水平a下接受原假设。
在实践中,当a=P值时,也即统计量的值C刚好等于临界值,为慎重起见,可増加样本容量,重新进行抽样检验。
P值是:
P值即概率,反映某一事件发生的可能性人小。
统汁学根据显著性检验方法所得到的P值,-•般以PV0.05为显著,P<
0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。
实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。
2.简述编制频数表的方法步骤及意义
3.简述二项分布和poisson分布的联系与区别
二项分布:
对只貝有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
Poisson分布是在兀很小,样本含量n趋于无穷大时,二项分布的极限形式。
当v=g时,(分布即为u分布,趋向正态分布。
4.简述非参数检验的优缺点,临床工作中如何选择?
优点:
(1)适用范围广,对变量的类型和分布无特殊要求,不受总体分布的限制;
(2)对数据的要求不严,对某些指标不便准确测定的资料也可应用;
(3)方法简便,易于理解和掌握。
缺点是如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低丁•非参数检验;
若耍使检验效能相同,往往需耍更大的样本含量。
09计算分析
1.用甲、乙两种方法分别测定一批空气样本CS2的含量(mg/m3)如下,已知本资料不满足参数检验的条件,试比较两种方法测定结果的差别有无统计学意义?
(写出完整步骤
CS2含量经正态性检验,不符合正态分布,现用Wilcoxon符号秩检验10个样本经屮,乙方法测得的CS2含量的比较
编号
甲法
乙法
差值d
正秩
负秩
1
40.7
50.0
-0.3
2
4.4
3
38,8
40.0
-1.2
4
45.2
42.2
7.5
1.3
3.3
・2
6
20.5
22.5
7
2.8
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 历年 doc