化验结果诊断模型参考答案.docx
- 文档编号:8830663
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:25
- 大小:76.29KB
化验结果诊断模型参考答案.docx
《化验结果诊断模型参考答案.docx》由会员分享,可在线阅读,更多相关《化验结果诊断模型参考答案.docx(25页珍藏版)》请在冰豆网上搜索。
化验结果诊断模型参考答案
化验结果诊断模型
问题重述与分析
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
本题给出了人们是否患某种疾病时通常要化验的几种指标以及其检验值。
表1是确诊病例的化验结果,其中1-30号病例是已经确诊为患该种疾病的化验结果;31-60号病例是已经确诊为健康人的结果。
表2是某些就诊人员的化验结果,但未确诊其是否患有该种疾病。
根据已知数据,需要解答如下问题:
1)问题:
根据表1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
分析:
根据表1当中60个化验结果,将Zn、Cu、Fe、Ca、Mg、K、Na看成是七个指标,则前30个为该疾病患者的指标值,后30个为健康人的指标值,可以将这些数据进行标准化处理,再采用主成分分析方法,将多个指标转化为几个综合指标,当给定一个患者的各指标值时,可以算出各综合指标的得分,当这些得分满足一定条件时,如根据正负值可以判定为健康或疾病。
2)问题:
按照
(1)提出的方法,对表2中的15名就诊人员的化验结果进行判别,判定他们是患该种疾病的病人还是健康人。
分析:
由
(1)中已有的综合指标,根据给定的15名就诊人员的指标值计算出综合指标的得分,以此判断他们的健康状况。
3)问题:
能否根据表1的数据特征,确定哪些指标是影响人们患该疾病的关键或主要因素,以便减少化验的指标。
并根据你给出的结果,重复2的工作。
分析:
为了确定哪些指标是影响该疾病的主要因素,则需要确定出哪些因素在判别中起的权重最大,可以考虑采取回归模型,通过去除一些变量,然后比较各组的显著性与正确率,正确率最高的那组中的变量即为影响该疾病的主要因素。
一、模型假设
1)假设医院化验设备先进,化验过程科学可靠,化验结果真实可信,确诊情况(有病/健康人)符合实际。
2)在解决本题过程中,所有的化验结果只是针对该类疾病检验,并不考虑其他疾病的影响。
3)本文所建模型的检验结果只是作为医生为病人诊断的一个参考,医生为问诊人员作出最终判定还需考虑其他因素,但与本题求解无关。
二、符号说明
三、模型建立与求解
(一)问题一的求解:
模型一:
1、数据“标准化”
题目已给出了60为确诊病例的化验结果以及诊断结果,但是60个病例中各元素的含量的呈无规律性。
所以我们需要对原始数据进行处理,首先对其进行标准化分析:
用向量
=
表示每个就诊人员的化验结果,则
=
表示第α病人的化验结果。
将每个指标“标准化”,即做如下变换:
其中
,
标准化的数据见附录一。
2、主成分分析
对标准化的数据运用SPSS软件进行主成分分析,结果如表1、表2:
表1
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
3.129
44.702
44.702
3.129
44.702
44.702
2
1.973
28.192
72.894
1.973
28.192
72.894
3
.723
10.327
83.221
4
.570
8.147
91.368
5
.284
4.052
95.420
6
.204
2.912
98.332
7
.117
1.668
100.000
由表1可以看出,前两个主成分
,
的方差和占全部方差的比例为72.894%,我们就选取
为第一主成分,
为第二主成分,基本上保留了原来7个指标的信息,这样得到了2个新指标。
SPSS软件得到的这成分系数矩阵如表2:
表2:
成份矩阵a
成份
1
2
x1
.453
-.538
x2
.852
.293
x3
.682
.195
x4
.898
-.051
x5
.941
.094
x6
-.206
.856
x7
-.005
.904
由表2得到前2个主成分
,
的线性组合为:
=
=
(4.1)
3、模型验证
将60个就诊人员的化验结果带入(4.1)式得到结果如表3,我们的判别标准为:
第一主成分为正值表示健康,为负值表示患病。
表3:
病例号
第一主成分
第二主成分
正误判标志(正=0;误=1)
1
-1.49142
0.23997
0
2
-1.14428
-0.18983
0
3
-1.28134
0.07538
0
4
-1.49664
1.27685
0
5
-0.5735
-1.82009
0
6
-1.58142
-1.32159
0
7
-1.22966
-1.94616
0
8
-1.76188
0.86386
0
9
-2.16782
-0.99101
0
10
-1.70022
0.09606
0
11
-3.45313
8.3533
0
12
-1.79041
0.81834
0
13
-0.42078
-0.98245
0
14
-1.80823
-0.49929
0
15
-2.03276
0.68222
0
16
-1.44607
-0.50165
0
17
-2.01446
0.70872
0
18
-0.85694
-0.3205
0
19
-1.06155
2.25198
0
20
-3.60188
3.81686
0
21
-3.6008
4.08631
0
22
-1.47019
1.01608
0
23
-0.89605
-1.51287
0
24
-4.29535
0.05951
0
25
-1.54492
-1.80111
0
26
-2.1294
1.19
0
27
-3.17737
-0.35639
0
28
-2.92407
0.77313
0
29
-4.09657
4.48592
0
30
-0.27663
-1.23729
0
31
1.32902
-1.89114
0
32
-0.22283
-0.92755
1
33
-0.59422
-1.62104
1
34
0.49476
-0.72864
0
35
0.16255
-1.64628
0
36
0.60017
-1.80156
0
37
0.49891
-1.12276
0
38
-1.10205
-1.66468
1
39
0.90498
2.12586
0
40
17.60042
4.83598
0
41
1.86782
-0.25856
0
42
1.34229
-1.57748
0
43
-0.18802
0.54153
1
44
1.42776
-1.5363
0
45
2.81954
-0.5207
0
46
0.40085
-2.06658
0
47
1.1396
-0.99288
0
48
1.62295
1.90336
0
49
6.18269
1.17307
0
50
3.73368
-0.48252
0
51
4.01664
0.79222
0
52
2.24093
-0.42976
0
53
1.01309
0.4541
0
54
-0.23626
-1.03562
1
55
1.9522
-2.26504
0
56
1.389
-1.7801
0
57
3.45006
-1.06684
0
58
2.94115
-1.71942
0
59
0.06593
-1.09379
0
60
0.45845
-0.90086
0
由表3可以看出,前30个就诊人员的第一主成分均为负值,判定为患病,后30个就诊人员的第一主成分大致上为正值,判定为健康,正确率为91.6667%。
(二)问题二的求解
由模型一得到前两个主成分的线性组合为:
=
=
将15名待诊人员的化验结果带入上式得:
表4:
病例号
第一主成分
第二主成分
61
-5.20057841
1.48976495
62
-3.70917326
-1.17618222
63
-3.33417236
-0.18521219
64
-2.46849776
-1.17181594
65
3.44950972
-0.30168201
66
-0.01013698
4.88191976
67
-1.53876026
0.8829813
68
-0.4575774
-0.70249665
69
0.7083415
-1.07835557
70
3.5182755
-0.25750581
71
1.40770589
-0.63732864
72
2.04054597
-1.29664076
73
2.69524135
-0.85109768
74
3.11945951
-1.04334549
75
-0.22020116
1.44700283
用第一主成分来判定化验结果,由表4可知,15名待诊人员中有8名患有该疾病,7名健康。
(三)模型一的改进:
模型二:
Logistic回归模型
问题一的模型的正确率为91.6667%,因此考虑正确率更高的其他模型,且模型一中忽略了第二主成分的作用,故解释时有较大误差。
以Y=0表示健康,Y=1表示不健康,考虑的因变量为一个二元变量,且只取0与1两个值,因变量取1的概率
为要研究的对象,且
是
的线性函数,故考虑采用Logistic线性回归模型。
对附录一中的数据运用SPSS进行Logistic回归分析得表5:
表5:
方程中的变量
B
S.E,
Wals
df
Sig.
Exp(B)
步骤1a
x1
.489
48.943
.000
1
.992
1.630
x2
.347
276.987
.000
1
.999
1.415
x3
-1.479
160.310
.000
1
.993
.228
x4
-.088
7.972
.000
1
.991
.916
x5
.021
62.318
.000
1
1.000
1.021
x6
.234
109.431
.000
1
.998
1.264
x7
.015
32.972
.000
1
1.000
1.016
常量
33.470
7350.783
.000
1
.996
3.435E14
由表5可以看出
这7个变量都是显著的,因而最终的回归方程为:
根据以上公式,我们可以将这个模型计算出来的
应用于实际病例的判别。
只要给出某一个受检者的化验结果,就能应用此计算公式算出其患病几率,我们以0.5为参照,当
>0.5时表示该受检者患病,当
<0.5时表示该受检者健康。
具体数据如下:
病号
x1
x2
x3
x4
x5
x6
x7
是否健康
判别结果
1
166
15.8
24.5
700
112
179
513
1
1
2
185
15.7
31.5
701
125
184
427
1
1
3
193
9.8
25.9
541
163
128
642
1
1
4
159
14.2
39.7
896
99.2
239
726
1
1
5
226
16.2
23.8
606
152
70.3
218
1
1
6
171
9.29
9.29
307
187
45.5
257
1
1
7
201
13.3
26.6
551
101
49.4
141
1
1
8
147
14.5
30
659
102
154
680
1
1
9
172
8.85
7.86
551
75.7
98.4
318
1
1
10
156
11.5
32.5
639
107
103
552
1
1
11
132
15.9
17.7
578
92.4
1314
1372
1
1
12
182
11.3
11.3
767
111
264
672
1
1
13
186
9.26
37.1
958
233
73
347
1
0.999999839
14
162
8.23
27.1
625
108
62.4
465
1
1
15
150
6.63
21
627
140
179
639
1
1
16
159
10.7
11.7
612
190
98.5
390
1
1
17
117
16.1
7.04
988
95.5
136
572
1
1
18
181
10.1
4.04
1437
184
101
542
1
1
19
146
20.7
23.8
1232
128
150
1092
1
1
20
42.3
10.3
9.7
629
93.7
439
888
1
1
21
28.2
12.4
53.1
370
44.1
454
852
1
1
22
154
13.8
53.3
621
105
160
723
1
1
23
179
12.2
17.9
1139
150
45.2
218
1
0.999999819
24
13.5
3.36
16.8
135
32.6
51.6
182
1
0.999999998
25
175
5.84
24.9
807
123
55.6
126
1
1
26
113
15.8
47.3
626
53.6
168
627
1
0.999999994
27
50.5
11.6
6.3
608
58.9
58.9
139
1
0.99999993
28
78.6
14.6
9.7
421
70.8
133
464
1
1
29
90
3.27
8.17
622
52.3
770
852
1
1
30
178
28.8
32.4
992
112
70.2
169
1
0.999999938
31
213
19.1
36.2
2220
249
40
168
0
0
32
170
13.9
29.8
1285
226
47.9
330
0
0
33
162
13.2
19.8
1521
166
36.2
133
0
0
34
203
13
90.8
1544
162
98.9
394
0
0
35
167
13.1
14.1
2278
212
46.3
134
0
0
36
164
12.9
18.6
2993
197
36.3
94.5
0
0
37
167
15
27
2056
260
64.6
237
0
0
38
158
14.4
37
1025
101
44.6
72.5
0
0
39
133
22.8
31
1633
401
180
899
0
0
40
156
135
322
6747
1090
228
810
0
0
41
169
8
308
1068
99.1
53
289
0
0
42
247
17.3
8.65
2554
241
77.9
373
0
0
43
166
8.1
62.8
1233
252
134
649
0
0
44
209
6.43
86.9
2157
288
74
219
0
0
45
182
6.49
61.7
3870
432
143
367
0
0
46
235
15.6
23.4
1806
166
68.8
188
0
0
47
173
19.1
17
2497
295
65.8
287
0
0
48
151
19.7
64.2
2031
403
182
874
0
0
49
191
65.4
35
5361
392
137
688
0
0
50
223
24.4
86
3603
353
97.7
479
0
0
51
221
20.1
155
3172
368
150
739
0
0
52
217
25
28.2
2343
373
110
494
0
0
53
164
22.2
35.5
2212
281
153
549
0
0
54
173
8.99
36
1624
216
103
257
0
0
55
202
18.6
17.7
3785
225
31
67.3
0
0
56
182
17.3
24.8
3073
246
50.7
109
0
0
57
211
24
17
3836
428
73.5
351
0
0
58
246
21.5
93.2
2112
354
71.7
195
0
0
59
164
16.1
38
2135
152
64.3
240
0
0
60
179
21
35
1560
226
47.9
330
0
0
61
85.5
1.7
3.99
503
62.3
238
762.6
1
62
144
0.7
15.1
547
79.7
71
218.5
1
63
85.7
1.09
4.2
790
170
45.8
257.9
0.999999987
64
176
0.57
27.3
318
133
99.4
318.8
1
65
192
7.06
32.9
1969
343
103
553
0
66
188
8.28
22.6
1208
231
1314
1372
1
67
153
5.87
34.8
328
163
264
672.5
1
68
171
10.5
30.5
672
145
47
330.5
1
69
162
13.2
19.8
1521
166
36.2
133
0
70
203
13
90.8
1544
162
98.9
394.5
0
71
164
20.1
28.9
1062
161
47.3
134.5
0.712652164
72
167
13.1
14.1
2278
212
36.5
96.5
0
73
164
12.9
18.6
2993
197
65.5
237.8
0
74
167
15
27
2056
260
44.8
72
0
75
158
14.4
37
1025
101
180
899.5
1
由上表可以看出,改进后的模型正确率非常高。
且15名就诊人员中有9人患病,6人健康。
(四)问题三的模型建立与求解
由模型二中的表5知,
的各显著性水平分别为:
X1
X2
X3
X4
X5
X6
X7
0.992
0.999
0.993
0.991
1.000
0.998
0.996
因此我们将各种元素进行组合排除,将
分别去掉,比较去掉后该回归的各个参量的值,以标准误差和正确率作为评判假设是否合理的依据。
再将
去除,重新建立回归模型,以相同标准进行评判。
同理,分别从
去除2—3个量作为一组,进行评判。
最后依照相同的方法每两个、每三个进行分组,均依上述标准评判,具体分组不再赘述。
下面仅就回归后正确率比较大的两组组给出分析结果。
1、去除
三个变量,由SPSS软件得到的结果见附录二
回归方程为:
病号
x1
x2
x3
x4
x5
x6
x7
是否健康
判别结果
1
166
15.8
24.5
700
112
179
513
1
1.00
2
185
15.7
31.5
701
125
184
427
1
1.00
3
193
9.8
25.9
541
163
128
642
1
1.00
4
159
14.2
39.7
896
99.2
239
726
1
1.00
5
226
16.2
23.8
606
152
70.3
218
1
0.71
6
171
9.29
9.29
307
187
45.5
257
1
0.87
7
201
13.3
26.6
551
101
49.4
141
1
0.95
8
147
14.5
30
659
102
154
680
1
1.00
9
172
8.85
7.86
551
75.7
98.4
318
1
1.00
10
156
11.5
32.5
639
107
103
552
1
1.00
11
132
15.9
17.7
578
92.4
1314
1372
1
1.00
12
182
11.3
11.3
767
111
264
672
1
1.00
13
186
9.26
37.1
958
233
73
347
1
0.04
14
162
8.23
27.1
625
108
62.4
465
1
1.00
15
150
6.63
21
627
140
179
639
1
1.00
16
159
10.7
11.7
612
190
98.5
390
1
0.98
17
117
16.1
7.04
988
95.5
136
572
1
1.00
18
181
1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 化验 结果 诊断 模型 参考答案