中药统计学第5章题解.docx
- 文档编号:3625887
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:17
- 大小:114.20KB
中药统计学第5章题解.docx
《中药统计学第5章题解.docx》由会员分享,可在线阅读,更多相关《中药统计学第5章题解.docx(17页珍藏版)》请在冰豆网上搜索。
中药统计学第5章题解
5相关与回归题解
习题5.1解答
1.查《伤寒论》中黄连汤、人参汤、生姜泻心汤等14个使用甘草与干姜的处方,其配伍使用量如表5-3所示。
求《伤寒论》使用甘草与干姜的处方中,甘草用量与干姜用量相关系数的r,并进行检验。
表5-3《伤寒论》中甘草与干姜用量(g)
用药
处方
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甘草X
12
6
9
6
6
9
9
12
9
6
0.75
6
9
9
干姜Y
6
4.5
9
4.5
6
9
3
9
9
9
0.75
4.5
9
9
解这是计量资料,以横轴表示甘草用量(g),纵轴表示干姜用量(g),画出如图5-11所示的散点图。
可以看出,散点图有直线趋势,故进行直线相关分析。
H0:
总体相关系数ρ=0,H1:
ρ
0。
计算得到
n=14,
=7.7679,SX=2.9063
=6.5893,SY=2.7935,∑XY=783.5625
r=
=0.6346
图5-11甘草与干姜散点图
查统计用表19(相关系数界值表),r0.05/2(12)=0.5324,双侧P<0.05,按=0.05水准双侧检验拒绝H0。
可以认为甘草用量X(g)与干姜用量Y(g)有正向直线相关关系。
2.某医师用免疫方法治疗肢体硬化,治疗6个月后,结果如表5-4所示,试分析残废指数Y与病程X间的关系。
表5-4残废指数Y与病程X间的关系
研究变量
病人编号
1
2
3
4
5
6
7
8
9
10
11
病程X
1
1
1
1
1
2
2
4
6
6
9
残废指数Y
3
2
5
6
5
7
6
6
7
7
7
解这是计量资料,以横轴表示病程X(年),纵轴表示残废指数y,画出如图5-12所示的散点图。
可以看出,散点图有直线趋势,故进行直线相关分析。
H0:
总体相关系数ρ=0,H1:
ρ
0。
计算得到
n=11,
=3.0909,SX=2.7732
=5.5455,SY=1.6949,∑XY=218
r=
=0.6266
图5-12病程与残废指数散点图
查统计用表19(相关系数界值表),r0.05/2(9)=0.6021,双侧P<0.05,按=0.05水准双侧检验拒绝H0。
可以认为残废指数y与病程x间有正向直线相关关系。
3.不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如表5-5所示,试分析地方性甲状腺肿患病率与水中平均碘含量的关系。
表5-5地方性甲状腺肿患病率与水中碘含量的关系
研究变量
地区编号
1
2
3
4
5
碘含量X
10.0
2.0
2.5
3.5
24.5
患病率Y
40.5
37.7
39.0
20.0
0.0
解以横轴表示水中平均碘含量X(单位),纵轴表示甲状腺肿患病率Y(%),绘出如图5-13所示的散点图。
散点图有直线趋势,但患病率Y(%)是百分数,不服从正态分布,故选用Spearman检验。
H0:
总体相关系数ρ=0,H1:
ρ
0。
分别将两个变量从小到大编秩,计算出每对观察值的秩次之差d,如表5-26所示,无相同秩次。
图5-13碘含量与患病率散点图
∑d2=2×12+2×22+42=26
rs=
=-0.3
表5-26碘含量与患病率资料编秩
X的秩次
4
1
2
3
5
T1=15
Y的秩次
5
3
4
2
1
T2=15
秩次之差d
-1
-2
-2
1
4
查统计用表20(rS界值表),r0.05/2(5)=1.000,双侧P>0.05,不能按=0.05水准双侧检验拒绝H0。
不能认为地方性甲状腺肿患病率与水中平均碘含量有负向直线相关关系。
表5-6出血症状Y与血小板数X(109/L)的关系
研究变量
病例编号
1
2
3
4
5
6
7
8
9
10
11
12
血小板数X
160
310
420
540
740
1060
1260
1230
1440
2000
160
310
出血症状Y
++
+++
+
-
+
+
-
-
-
-
+
-
4.根据如表5-6所示资料,分析出血症状Y与血小板数X(109/L)的关系。
解这是等级资料,为绘制散点图,先量化出血症状,等级-、+、++、+++,分别量化为0、1、2、3。
由如图5-14所示的散点图可以看出,血小板数x与出血症状y的关系有直线趋势,故进行直线相关分析。
这里,选用Spearman检验。
H0:
ρ=0,即y与x之间无联系;H1:
ρ
0。
图5-14出血症状散点图
分别将两个变量从小到大编秩,计算出每对观察值的秩次之差d,如表5-27所示。
表5-27血小板和出血症状资料
X的秩次
1.5
3.5
5
6
7
8
9
10
11
12
1.5
3.5
Y的秩次
11
12
8.5
3.5
8.5
8.5
3.5
3.5
3.5
3.5
8.5
3.5
秩次之差d
-9.5
-8.5
-3.5
2.5
-1.5
-0.5
5.5
6.5
7.5
8.5
-7
0
本例血小板数有2个160、2个310,出血症状有6个-、4个+,由n=12,计算得到
∑d2=433.5,Tx=2(23-2)/12=1,Ty=[(63-6)+(43-4)]/12=22.5
rsc=
=-0.6536
查统计用表20(rS界值表),r0.05/2(10)=0.648,双侧P<0.05,以=0.05水准双侧检验拒绝H0,可以认为2~7岁急性白血病患儿的血小板数与出血症状之间有负向直线相关关系。
习题5.2解答
1.查四君子汤等治疗气虚证的6个处方中,人参(X1)、白术(X2)二味中药的用量如表5-9所示,作回归分析。
若人参用量为9克,则白术配伍用量为多少?
表5-9治疗气虚证6个处方的人参与白术二味中药用量
用药
处方
四君子汤
参芩白术散
补中益气汤
生脉散
八珍汤
炙甘草汤
人参X1
12
1000
10
10
6
6
白术X2
9
1000
10
0
9
0
解这是计量资料,治疗气虚证的6个处方中人参与白术的散点图如图5-15所示,有直线趋势,适于作回归直线分析。
由n=6、
=174.0000、SX=404.6628、
=171.3333、SY=405.9880、∑XY=1000262,得到
lXY=1000262-6×174×171.3333
=821390.0000
图5-15人参与白术散点图
lXX=(6-1)1742=818760.0000
b=821390/818760=1.0032
a=171.3333-1.0032×174=-3.2256
r=
=0.9999
查统计用表19(r界值表),r0.001/2(4)=0.9741,双侧P<0.01,线性回归方程
=–3.2256+1.0032X有统计学意义。
R2=0.99992=0.9999
由R2>0.7,可以认为两变量的相关强度较大,线性回归方程拟合效果较好。
可以认为在治疗气虚证时,人参与白术配伍用量有协同作用(有联合相加作用)。
从该方程的回归系数b=1.0032可知,治疗气虚证时,人参用量每增加或改变1克,白术配伍用量平均改变约1克,若人参用量为9克,则白术用量为–3.2256+1.0032×9=5.8033克,即宜配白术用量5.8克,有利于节省药量,发挥最佳药效。
2.对习题5.1的1题数据,建立干姜用量Y(g)关于甘草用量X(g)的回归方程。
解这是计量资料,散点图有直线趋势。
n=14,
=7.7679,SX=2.9063,
=6.5893,SY=2.7935,∑XY=783.5625
r=0.6346,双侧P<0.05,线性回归方程有统计学意义。
lXY=783.5625-14×7.7679×6.5893=66.9777
lXX=(14-1)2.90632=109.8080
b=821390/818760=0.6100
a=6.5893-0.6100×7.7679=1.8513
R2=0.63462=0.4029
由R2<0.7,两变量的相关强度一般,干姜用量Y(g)关于甘草用量X(g)的线性回归方程拟合效果不太好,即
=1.8513+0.6100X可以使用。
3.对习题5.1的2题数据,建立残废指数Y与病程X(年)的回归方程。
解这是计量资料,散点图有直线趋势。
n=11,
=3.0909,SX=2.7732,
=5.5455,SY=1.6949,∑XY=218
r=0.6266,双侧P<0.05,线性回归方程有统计学意义。
lXY=218-11×3.0909×5.5455=29.4545
lXX=(11-1)2.77322=76.9091
b=29.4545/76.9091=0.3830
a=6.5893-0.6100×7.7679=4.3617
R2=0.63462=0.3927
由R2<0.7,两变量的相关强度一般,残废指数Y与病程X(年)的线性回归方程拟合效果不太好,即
=4.3617+0.3830X可以使用
4.用双波长薄层扫描仪测定紫草含量,浓度C(mg/100ml)与测得积分值H数据如表5-10所示,建立积分值H关于浓度C的回归方程。
在C0=12时,求H0的95%预测区间。
表5-10紫草含量浓度C与测得积分值H数据
浓度C
5
10
15
20
25
30
积分值H
15.2
31.7
46.7
58.9
76.9
82.8
解这是计量资料,散点图如图5-16所示,有直线趋势,适于作回归直线分析。
n=6,
=17.5,SX=9.3541,
=52.0333,SY=26.1177,∑XY=6678
lXY=6678-6×17.5×52.0333=1214.5
lXX=(6-1)9.35412=437.5
b=1214.5/437.5=2.7760
a=52.0333-2.7760×17.5=3.4533
r=
=0.9942
图5-16紫草浓度与积分值散点图
查统计用表19,r0.001/2(4)=0.9741,双侧P<0.01,线性回归方程
=3.4533+2.7760X有统计学意义。
R2=0.99422=0.9885
由R2>0.9,认为两变量的相关强度较大,线性回归方程拟合效果较好,即
=3.4533+2.7760C可以使用
查统计用表5得
=2.7765,计算得
=3.4533+2.7760×12=36.7653
SY·X=
=3.1313
=
紫草含量浓度C0=12(mg/100ml)时,可预测积分值数据H0约有95%在
范围内。
5.用显微定量法测定二陈丸的甘草浓度x(mg/mL)与镜检晶纤维的数目y,得到如表5-11所示资料,作回归分析。
甘草浓度4mg/mL时,预测晶纤维数目总体均数95%可信区间。
表5-11二陈丸的甘草浓度与镜检晶纤维的数目
甘草浓度X
2.07
3.10
4.14
5.17
6.20
晶纤维数Y
128
194
273
372
454
解这是计量资料,散点图如图5-16所示,有直线趋势,适于作回归直线分析。
n=5,
=4.136,SX=1.6333,
=284.2,SY=131.5302,∑XY=6734.62
lXY=6734.62-5×4.1360×284.2000
=857.3640
lXX=(5-1)1.63332=10.6709
b=857.364/10.6709=80.3458
a=284.2-80.3458×4.1360=-48.1104
r=
=0.9977
图5-16浓度与晶纤维散点图
查统计用表19(r界值表),r0.001/2(3)=0.9911,双侧P<0.01,线性回归方程
=-48.1104+80.3458x有统计学意义。
R2=0.99772=0.9954
由R2>0.7,可以认为两变量的相关强度较大,线性回归方程拟合效果较好,即
=-48.1104+80.3458X可以使用。
查统计用表5得
=3.1825,计算得
=-48.1104+3.1825×4=273.2730
SY·X=
=10.2497
=
甘草浓度4mg/mL时,预测晶纤维数目总体均数95%的可信区间为
。
习题5.3解答
1.二酰肼生成值(g/L)受压力(mmHg)的影响,资料如表5-18所示,试建立二酰肼生成值Y与压力X的回归方程。
图5-17压力X与二酰肼生成值Y的(X,Y)、(lnX,Y)、(lnX,lnY)散点图
表5-18不同压力的二酰肼生成值资料
压力X(mmHg)
15
30
50
100
300
760
二酰胼值Y(g/L)
55.0
38.0
25.0
14.5
6.6
2.6
解比较如图5-17所示压力X与二酰肼生成值Y的(X,Y)、(lnX,Y)、(lnX,lnY)数据散点图,选择幂函数回归ln
=a+blnX。
计算数据的对数值,如表5-28所示,即
表5-28不同压力的二酰肼生成值数据的对数值
lnX
2.7081
3.4012
3.9120
4.6052
5.7038
6.6333
lnY
4.0073
3.6376
3.2189
2.6741
1.8871
0.9555
用(lnX,lnY)数据作直线回归计算,得到
a=6.2250,b=-0.7777,R2=0.9939,r=0.9970,双侧P<0.01
建立二酰肼生成值Y与压力X的回归方程ln
=6.2250-0.7777lnX有统计学意义。
X=15、30、50、100、300、760时,ln
=4.1189、3.5799、3.1826、2.6436、1.7892、1.0663,拟合较好。
2.薄层扫描测定心康胶囊中人参皂苷Rgl含量,辽宁中医2002年第29卷第2期。
测得数据如表5-19所示,建立Y与X的回归方程。
表5-19薄层扫描测定心康胶囊中人参皂苷Rgl含量
Rgl净含量
1.992
3.984
5.976
7.968
9.960
色谱峰面积
16720
32949
47356
69084
86910
解比较如图5-18所示人参皂苷Rgl含量X与色谱峰面积Y的(X,Y)、(lnX,Y)、(lnX,lnY)数据散点图,可以选择线性回归
=a+bX或幂函数回归ln
=a+blnX。
图5-18人参皂苷Rgl含量X与色谱峰面积Y的(X,Y)、(lnX,Y)、(lnX,lnY)散点图
若选择线性回归,则用(X,Y)数据作直线回归计算,得到
a=-2350.7000,b=8861.1948,R2=0.9955,r=0.9977,双侧P<0.01
色谱峰面积Y与人参皂苷Rgl含量X的直线回归方程有统计学意义。
由R2>0.9,认为两变量的相关强度较大,线性回归方程拟合效果较好,即
=-2350.7000+8861.1948X可以使用
若选择幂函数回归,则计算数据的对数值如表5-29所示,即
表5-29Rgl含量X与色谱峰面积Y数据的对数值
lnX
0.6891
1.3823
1.7878
2.0754
2.2986
lnY
9.7244
10.4027
10.7654
11.1431
11.3726
用(lnX,lnY)数据作直线回归计算,得到
a=8.9993,b=1.0217,R2=0.9969,r=0.9984,双侧P<0.01
色谱峰面积Y与人参皂苷Rgl含量X的回归方程ln
=8.9993+1.0217lnX有统计学意义。
X=1.992、3.984、5.976、7.968、9.960时,ln
=9.7034、10.4116、10.8258、11.1197、11.3477,拟合较理想。
3.根据例3数据,求LD50及其95%预测区间。
解删除P=0或100的数据,查统计用表22概率单位X、计算对数剂量lgD,如表5-30所示,即
用整理后的(X,lgD)数据作直线回归计算,
表5-30小白鼠的死亡数据的概率单位
死亡率P
7.6923
30
63.6364
84.6154
94.1176
概率单位X
3.5739
4.4756
5.3488
6.0201
6.5647
对数剂量lgD
0.3010
0.3979
0.4771
0.5441
0.6021
得到
=5.1966、SX=1.1964、
=0.4644、SY=0.1189、∑XY=12.6366
lXY=12.6366-5×5.1966×0.4644=0.5689
lXX=4×1.19642=5.7260,lYY=4×0.11892=0.0566
b=0.5689/5.7260=0.0994,a=0.4644-0.0994×5.1966=-0.0519
r=0.5689/
=0.9996,双侧P<0.01
R2=0.99962=0.9992>0.7
概率单位X与对数剂量lgD间的曲线拟合方程lnD=-0.0519+0.0994X有统计意义。
X=5时,
=0.4449,LD50的点估计值=100.4449=2.7855。
SY·X=
=0.0039
查统计用表5,t0.05/2(3)=3.1825,得到lgLD50的95%预测区间
LD50的95%预测区间为
mg/g。
习题5.4解答
1.测定15名糖尿病人的血糖Y(mmol/L)、胰岛素X1(Mu/L)及生长素X2(μg/L)的数值如表5-23所示,试建立血糖对于胰岛素及生长素的二元线性回归方程。
表5-23糖尿病人的血糖、胰岛素及生长素的含量
研究变量
病例号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
血糖Y
12.21
14.54
12.27
12.04
7.88
11.10
10.43
13.32
19.59
9.05
6.44
9.49
10.16
8.38
8.49
胰岛素X1
15.20
16.70
11.90
14.00
19.80
16.20
17.00
10.30
2.90
18.70
25.10
16.40
22.00
23.10
23.20
生长素X2
9.51
11.43
7.53
12.17
2.33
13.52
10.07
18.89
13.14
9.63
5.10
4.53
2.16
4.26
3.42
解由数据计算得到
l11=459.6133、l12=-277.3543、l13=-233.3400、l22=331.8057、l23=145.4746、l33=146.6662、
=16.8333、
=8.5127、
=11.0260
构成正规方程组,即
解得b1=-0.4906、b2=0.0284
计算得到b0=11.0260+0.4906×16.8333-0.0284×8.5127=19.0424
SS回=0.4906×277.3543-0.0284×233.3400=118.5962、df回=2
SS剩=146.6662-118.5962=28.0700、df剩=15-2-1=12
R2=118.5962/146.6662=0.8086、R=0.8992
F=(12×118.5962)/(2×28.0700)=25.3501,双侧P<0.01
血糖对于胰岛素及生长素的二元线性回归方程有统计意义,即
=-0.5785+0.3785X1+0.4523X2可以使用
2.芦荟属植物叶的结构与蒽醌类物质的关系,中草药2001年第32卷第4期。
测得数据如表5-24所示,其中,X1为维管束的分布密度,X2为大型薄壁细胞占维管束体积的比值,X3为同化组织厚度,Y为蒽醌类物含量。
建立Y关于X1、X2、X3的逐步回归方程。
表5-24芦荟属植物叶的结构与蒽醌类物质的关系
试验号
X1分布密度
X2薄壁细胞比值
X3同化组织厚度
Y蒽醌类物含量
1
1.38
1.38
830
8.5
2
2.40
1.80
1100
22.2
3
3.40
3.10
1240
63.0
4
1.38
1.38
830
8.5
5
2.40
1.80
1100
22.2
6
3.40
3.10
1240
63.0
解计算得到
R=0.99997、F=68289.2373、P=0.0000<0.01
逐步回归方程有统计意义,即
=-34.9465+31.6146X2可以使用
表5-2526例肾切除的肾癌患者资料
Y
0
0
0
1
1
0
0
0
0
0
0
1
0
0
1
0
1
0
0
1
1
0
1
0
0
1
X1
2
1
2
3
3
1
1
1
1
3
3
2
1
1
3
1
3
1
1
3
2
2
3
2
1
3
X2
2
1
2
4
3
2
1
3
1
2
4
4
1
2
3
2
3
2
2
4
4
2
3
2
4
4
3.某研究人员收集26例肾切除的肾癌患者资料,Y=1表示肾癌细胞转移,X1表示肾癌细胞血管内皮生长因子的四个等级,X2表示肾癌细胞核组织的四个等级,数据如表5-25所示,建立Y与X1、X2的Logistic回归方程。
解计算得到
对数似然度L=5.9129、似然比卡方=13.4581、显着水平P=0.0037<0.01
Logistic回归方程有统计学意义,即
logit(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中药 统计学 题解