计算机模拟统计效率.docx
- 文档编号:2366220
- 上传时间:2022-10-29
- 格式:DOCX
- 页数:15
- 大小:409.21KB
计算机模拟统计效率.docx
《计算机模拟统计效率.docx》由会员分享,可在线阅读,更多相关《计算机模拟统计效率.docx(15页珍藏版)》请在冰豆网上搜索。
计算机模拟统计效率
计算机模拟统计效率
目录
模拟方法的介绍
病例对照研究中统计效率模拟分析方法的运用
∙病例对照研究的定义
∙回归模型
∙有交互作用的回归模型
∙模拟过程需要的参数
队列研究中统计效率模拟方法的运用(暴露组与非暴露组的随访)
∙队列研究的定义
∙回归模型
∙有交互作用的回归模型
∙模拟过程需要的参数
横断面研究或队列研究(随访一个人群)中统计效率模拟分析的运用
∙横断面研究的定义
∙回归模型
∙有交互作用的回归模型
∙模拟过程需要的参数
易侕统计软件中统计效率模拟分析包的使用
∙输入截图举例
∙输出截图举例
∙其他输入选项
模拟方法:
1.用相应模型按以下参数
(1)指定的样本量;
(2)要检测的效应大小;
(3)变量相关基本参数(如:
均数,方差,发病率)产生随机数据。
2.在随机生成的数据上运行回归模型,保存参数估计值及P值。
3.重复上述步骤N次,P值小于显著性检验水准的次数占总重复次数(N)的比例,即为检验效率估计值。
病例对照研究中统计效率模拟分析的运用
病例对照研究定义:
以确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,通过回顾性地搜集研究对象既往可能的危险因素的暴露史,比较病例组与对照组各因素的暴露比例(如果暴露是分类变量,如吸烟),或暴露水平(如果暴露是连续性变量,如体质指数BMI),以探索和检验病因假说。
回归模型
Y为是否患病的二分类变量,因此适用logistic回归模型
log(p/(1-p))=β0+β1*X
p/(1-p)是发病的比值,X为暴露,如果X是二分类变量(0或1),eβ1是暴露组比非暴露组患病的比值比,指暴露者患病危险性为非暴露者的多少倍。
如果X是连续性变量,eβ1是暴露每改变一个单位患病风险的OR值。
两种暴露交互作用的回归模型
Log(p/(1-p))=β0+β1*X1+β2*X2+β3*X1*X2
eβ1是在X2=0时,X1的效应(OR),称X1的主效应
eβ2是在X1=0时,X2的效应(OR),称X2的主效应
eβ3反映在X1、X2都存在时的附加效应,X1和X2的交互作用
拟合过程需要的参数
模型中只包含一个二分类暴露变量X
∙X在总人群中的暴露的率
∙X的OR值
∙样本量(包括病例数、对照数)
模型中包含一个连续性变量X
∙X在研究人群中的均数、标准差
∙X每改变一个单位,发病风险的OR值
∙样本量(包括病例数、对照数)
模型包含一个二分类变量X1和一个二分类变量X2
∙X1在目标人群中的暴露率
∙X2在目标人群的暴露率
∙X1=1时出现X2的比值与=0时出现X2的比值比,如果X1和X2相互独立,则为1。
∙样本量(包括病例数、对照数)
模型包含一个二分类变量X1和一个连续性变量X2
∙X1在总人群的暴露率
∙X在总人群中的均数、标准差
∙X1对X2的作用,即X1=1和=0时X2的均值的差值,如果X2和X1相互独立则为0。
∙交互作用项的OR值
∙样本量(病例数、对照数)
队列研究中的检验效能拟合
队列研究定义:
在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组等,随访观察一段时间,检查并登记各组人群某结局的发生情况,比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
队列研究分为前瞻性队列研究、历史性队列研究和双向性队列研究。
回归模型:
如果结果变量为二分类变量(0=是,1=否),适用logistic回归模型:
Log(p/(1-p))=β0+β1*X
p/(1-p)为是否患病的比值,X为暴露变量,X对Y的效应:
比值比(OR)=eβ1
如果结局变量为连续性变量,适用线性回归:
Y=β0+β1*X
X对Y的效应为回归系数,即β1
含两个暴露变量且有交互作用的回归模型
如果结局变量为二分类变量(0=否,1=是),适用于logistic回归模型
Log(p/(1-p))=β0+β1*X1+β2*X2+β3*X1*X2
eβ1是当X2=0时X1的效应(OR),即X1的主效应
eβ2是当X1=0时X2的效应(OR),即X2的主效应
eβ3反映X1和X2均存在时附加的效应(OR),即X1和X2的交互作用
如果结局变量为连续性变量,适用于线性回归
Y=β0+β1*X1+β2*X2+β3*X1*X2,
以回归系数来表示X对Y的效应
回归系数β1是当X2=0时X1的效应,即X1的主效应
回归系数β2是当X1=0时X2的效应,即X2的主效应
回归系数β3反映X1和X2均存在时附加的效应,即X1和X2的交互作用
模拟过程需要的参数
模型中包含二分类结局变量Y
∙Y在非暴露人群中的患病率
∙暴露变量X引起发病风险的OR值
∙样本量,包括非暴露人数,暴露人数
模型中包含连续性结局变量Y
∙Y在非暴露人群中的均数和标准差
∙X对Y回归系数
∙样本量,包括非暴露人数,暴露人数
二分类结局变量,探索暴露变量X1(二分类)和X2(二分类)的交互作用的模型
∙Y在非暴露人群中的患病率
∙X2在研究人群中的分布情况
∙X2与X1的联系,即有X1时出现X2的比值,与无X1时出现X2的比值比,若两者相互独立,则为1
∙X1的主效应(OR)
∙X2的主效应(OR)
∙交互作用效应(OR)
∙样本量,包括非暴露组人数,暴露组人数
连续性结局变量,探索暴露变量X1(二分类)和X2(二分类)的交互作用的模型
∙Y在非暴露人群中的均数和标准差
∙X2在研究人群中的分布情况
∙X2与X1的联系,即有X1时出现X2的比值,与无X1时出现X2的比值比,若两者相互独立,则为1
∙X1的主效应(回归系数)
∙X2的主效应(回归系数)
∙交互作用项的回归系数
∙样本量,包括非暴露组人数,暴露组人数
二分类结局变量,探索暴露变量X1(二分类)和X2(连续性)的交互作用的模型
∙Y在非暴露人群中的患病率
∙X2在研究人群中的均数和标准差
∙X1对X2的作用,即X1=1和X1=0时的X2的均值的差值,如果X2和X1相互独立,设为0
∙X1的主效应(OR)
∙X2的主效应(OR)
∙交互作用效应(OR)
∙样本量,包括非暴露组人数,暴露组人数
连续性结局变量,探索暴露变量X1(二分类)和X2(连续性)的交互作用的模型
∙Y在非暴露人群中的均数和标准差
∙X2在研究人群中的均数和标准差
∙X1对X2的作用,即X1=1和X1=0时的X2的均值的差值,如果X2和X1相互独立,设为0
∙X1的主效应(回归系数)
∙X2的主效应(回归系数)
∙交互作用项的回归系数
∙样本量,包括非暴露组人数,暴露组人数
横断面研究或者随访队列研究的统计效率模拟分析
定义:
旨在观察一组人群,收集所有暴露和结局的数据,进行关联性分析,探索暴露与结局间的关系,有别于一般的在两组人群中的研究(如病例对照研究,包括暴露组与非暴露组的队列研究)
回归模型:
如果结局变量为二分类(0=否,1=是),适用于logistic回归模型
Log(p/(1-p))=β0+β1*X
p/(1-p)是结局变量Y的比值,X是暴露变量
X对Y的效应为OR(比值比),即eβ1
如果结局变量为连续性变量,适用于线性回归:
Y=β0+β1*X
X对Y的效应为回归系数,即β1
包含两种暴露交互作用的回归模型
如果结局变量为二分类变量(0=否,1=是),适用于logistic回归模型
Log(p/(1-p))=β0+β1*X1+β2*X2+β3*X1*X2
eβ1是当X2=0时X1的效应(比值比),即X1的主效应
eβ2是当X1=0时X2的效应(比值比),即X2的主效应
eβ3反映X1和X2均存在时附加的效应(比值比),即X1和X2的交互作用
如果结局变量为连续性变量,适用于线性回归:
Y=β0+β1*X1+β2*X2+β3*X1*X2,
以回归系数来表示X对Y的效应
回归系数β1是当X2=0时X1的效应,即X1的主效应
回归系数β2是当X1=0时X2的效应,即X2的主效应
回归系数β3反映X1和X2均存在时附加的效应,即X1和X2的交互作用
统计模拟分析过程需要的参数
包含二分类结局变量Y和二分类暴露变量X的模型
∙Y在研究人群中的发生率
∙X在研究人群中出现的概率
∙暴露变量X对Y的作用(有X时发生Y的比值与无X时发生Y的比值比),即待计算的效应(OR)
∙样本量,包括研究对象总数
二分类结局变量Y和连续性暴露变量X的模型
∙Y在研究人群中的发生率
∙X在研究人群中的均数和标准差
∙X每改变一个单位,发生Y的比值比,即待计算的效应(OR)
∙样本量,包括研究对象总数
连续性结局变量Y和二分类暴露变量X的模型
∙Y在研究人群中的均数和标准差
∙X在研究人群中出现的概率
∙暴露变量X对Y的回归系数,待计算的效应
∙样本量,包括研究对象总数
连续性结局变量Y和连续性暴露变量X的模型
∙Y在研究人群中的均数和标准差
∙X在研究人群中的均数和标准差
∙X每改变一个单位对Y的回归系数,待检测的效应
∙样本量,包括研究对象总数
二分类结局变量,探索暴露变量X1(二分类)和X2(二分类)的交互作用的模型
∙Y在研究人群中的发生率
∙X1在研究人群中出现的概率
∙X2在研究人群中出现的概率
∙X2与X1的联系,即有X1时出现X2的比值,与无X1时出现X2的比值比,若两者相互独立,则定为1
∙X1的主效应(比值比)
∙X2的主效应(比值比)
∙交互作用项的比值比,待计算的效应
∙样本量,包括研究对象总数
二分类结局变量Y,探索暴露变量X1(二分类)和X2(连续性)的交互作用的模型
∙Y在研究人群中的发生率
∙X1在研究人群中出现的概率
∙X2在研究人群中的均数和标准差
∙X1对X2的作用,即X1=1和X1=0时的X2的均值的差值,如果X2和X1相互独立,设为0
∙交互作用项的比值比,待计算的效应
∙样本量,包括研究对象总数
连续性结局变量Y,探索暴露变量X1(二分类)和X2(二分类)的交互作用的模型
∙Y在研究人群中的均数和标准差
∙X1在研究人群中出现的概率
∙X2在研究人群中出现的概率
∙X2与X1的联系,即有X1时出现X2的比值,与无X1时出现X2的比值比,若两者相互独立,则定为1
∙X1的主效应(回归系数)
∙X2的主效应(回归系数)
∙交互作用项的回归系数
∙样本量,包括研究对象总数
连续性结局变量Y,探索暴露变量X1(二分类)和X2(连续性)的交互作用的模型
∙Y在目标人群中的均数和标准差
∙X1在研究人群中出现的概率
∙X2在研究人群中的均数和标准差
∙X1对X2的作用,即X1=1和X1=0时的X2的均值的差值,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 模拟 统计 效率