数学建模胃癌诊断Word文档下载推荐.docx
- 文档编号:19426813
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:12
- 大小:53.78KB
数学建模胃癌诊断Word文档下载推荐.docx
《数学建模胃癌诊断Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《数学建模胃癌诊断Word文档下载推荐.docx(12页珍藏版)》请在冰豆网上搜索。
关键词:
Excel多元线性回归最优化逐步回归
问题重述
人们到医院就诊时,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。
从胃癌患者中抽取5人(编号为1—5),从萎缩性胃炎患者中抽取5人(编号为6—10),以及非胃病者中抽取5人(编号为11—15),每人化验4项生化指标:
血清铜蓝蛋白(X1)、蓝色反应(x2)、尿吲哚乙酸(X3)、中性硫化物(x4),测量数据如表一所示(见附录3):
问题分析
要求我们提出简便的方法,判别就诊人员是患者还是健康者。
我们根据suo9提供的确诊病例中分析得知,人是否患病与人体内某些元素的含量成相应的回归关系,我们猜想是否能通过样本中患病与元素含量的普遍关系来建立回归模型,由模型来判别病例。
因此,我们先选取其中一部分数据进行研究,待建立模型后,将剩余的数据带入模型检。
问题假设
(1)假设题目所给的数据合理正确
(2)假设胃病患者体内各种元素的含量受其他疾病的影响较小;
(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;
(4)假设用于判断胃病患者的四种元素,不受人体内其他元素或化合物的影响。
符号说明
(1)
表示人体内各元素的含量
(2)
表示患病情况.
(3)p表示误判率
(4)n表示从总体中抽取的样本
(5)
表示线性回归方程的回归系数
模型建立与求解
模型一
(1)模型一的建立:
考虑一次线性回归模型,我们从总体中选取,1——3号,6—8号,11—13号病例作为研究样本,以人体内各元素的含量
为自变量;
人们是否患病为因变量。
设多元线性回归模型一般形式为:
------------
(1)
其中:
y是因变量,
(i=1,2,3,4)为四个对y有显著影响的自变量,
是5个待估参数。
对于n组实际观察数据,由
(1)得
-------
(2)
根据
(2)式多元线性回归模型可表示为:
---------------------------(3)
模型相应矩阵方程表示为:
Y=A*X--------------------(4)
由(4)式解得:
A=(X’*X)*X’*Y------------(5)
我们将样本数据代入(5)式,利用matlab(求解源程序见附录1)软件,求得个参数的线性回归系数分别为:
A=[0.0225-0.0023-0.002713.34063.9119]则
Y=0.0225-0.0023
-0.0027
+13.3406
+3.9119
----------(6)
(2)模型检验
将检测样本得值代入(6)式判别出6个样本患病情况为:
患癌症5号,萎缩性胃炎9号,非患病者4,10,14,15.由此可以看出,我们运用所求的判别函数所检验的结果与实际情况存在一定的误差,也就是说运用一次线性模型判定的结果存在一定的误判,其误判率大约为3/6=50%。
模型二
(1)模型二的建立
考虑一次项和平方项线性回归模型,我们从总体中选取,1——3号,6—8号,11—13号病例作为研究样本,以人体内各元素的含量
(i=1,2,3,4;
j=5,6,7,8)---------(7)
同模型一的解法,我们建立相应的方程和模型,我们将样本数据代入上式,利用MATLAB(求解源程序见附表2)软件,求得各参数项的线性回归系数分别为:
{
,
}=[-8.4679-0.09460.208979.931811.90740.0002-0.0008-256.9499-22.2668]
(2)模型检验
将检测样本得值代入(7)式判别出6个样本患病情况为:
患癌症5号,萎缩性胃炎9号,非患病者4,10,14,15.由此可以看出,我们运用所求的判别函数所检验的结果与实际情况存在一定的误差,也就是说运用一次线性模型判定的结果存在一定的误判,其误判率大约为2/6=33.3%.
模型三
综合以上模型,通过对两种模型结果的分析,我们发现一次项得到的结果检验最精确,但是拟合优度较低,为了验证各元素对胃病的影响,我们利用Excel分析了各元素的含量。
通过它们的曲线图发现X4元素的影响较为微小,所以剔除X4的数据,避免了不必要的运算,较小误差。
我们得到的最终模型为
我们将样本数据代入上式,利用Matlab软件,求得各参数项的线性回归系数分别为-0.9909、0.0032、0.0026、12.0133.
NoX1
癌症患者
萎缩性胃炎患者
费胃病患者
1
228
225
185
2
245
130
170
3
200
150
165
4
120
135
5
100
160
NoX2
134
125
115
167
117
142
133
108
NoX3
0.2
0.07
0.05
0.1
0.06
0.12
0.02
NoX4
0.11
0.14
0.19
0.4
0.04
0.27
0.08
0.26
模型检验
将检测样本的值代入(8)式,判别出六个样本患病情况为患癌症者为5号,萎缩性胃炎为9、10号,非患病者为4、14、15。
其误判率为1/6=16.7%。
模型分析
在问题中,我们通过对模型的优化,最终得到了较理想的模型,利用该模型对总体样本的检验结果与题意基本相符,有较高的正确性。
模型评价
1.优点
1)本文采用了线性回归的方法对模型进行了一系列的分析、处理,并选取部分样本进行计算,用已知的数据对所的结论进行了验证,比较简方便。
2)该模型简单,而且利用了数学软件MATLAB。
2.缺点
1)提供的数据较少,结果不是特别准确。
2)本文采用的图表分析与真实数据有一定误差。
模型的推广
这种判别方法在实际生活中应用较多,所以这些方法在日常发挥着很多作用,除了判断疾病之外,还可以在各单位评先进,选有活动中得到广泛推广。
在对影响事物的一些因素进行研究、判断时,可以通过主要成分分析,在多个元素中对最重要的一些元素进行筛选后研究,这样可以减少研究的难度,提高研究的效率,还可以减少微小因素带来的误差,所以这个模型在研究中有很好的推广前景。
附录
附录1
计算系数a
X=[1,228,134,0.2,0.11;
1,245,134,0.1,0.4;
1,200,167,0.12,0.27;
1,255,125,0.07,0.14;
1,130,100,0.06,0.12;
1,150,117,0.07,0.06;
1,185,115,0.05,0.19;
1,170,125,0.06,0.04;
1,165,142,0.05,0.08;
]
Y=[2;
2;
1;
0;
A=inv(X'
*X)*X'
*Y
A=
0.0225
-0.0023
13.3406
3.9119
检验模型
X1=[1,170,150,0.07,0.08;
1,100,167,0.2,0.14;
1,120,133,0.1,0.26;
1,160,100,0.05,0.1;
1,135,108,0.02,0.12;
1,100,117,0.07,0.02;
Y=X1*A
Y=
0.4702
2.5532
1.7355
0.4411
0.1545
0.4860
附录2
X1=[1,228,134,0.2,0.11;
X2=[228,134,0.2,0.11;
245,134,0.1,0.4;
200,167,0.12,0.27;
255,125,0.07,0.14;
130,100,0.06,0.12;
150,117,0.07,0.06;
185,115,0.05,0.19;
170,125,0.06,0.04;
165,142,0.05,0.08;
X3=X2.^2
X4=[X1X3]
A1=inv(X4'
*X4)*X4'
A1=
-8.4679
-0.0946
0.2089
79.9318
11.9074
0.0002
-0.0008
-256.9499
-22.2668
模型二检验
X5=[1,170,150,0.07,0.08;
X6=[170,150,0.07,0.08;
100,167,0.2,0.14;
120,133,0.1,0.26;
160,100,0.05,0.1;
135,108,0.02,0.12;
100,117,0.07,0.02;
X7=[X51X6.^2]
Y1=X7*A1
Y1=
0.7316
4.4497
4.3800
-0.6197
-1.1802
2.6308
模型优化
>
Y=[2;
X8=[1,228,134,0.2;
1,245,134,0.1;
1,200,167,0.12;
1,255,125,0.07;
1,130,100,0.06;
1,150,117,0.07;
1,185,115,0.05;
1,170,125,0.06;
1,165,142,0.05;
X8=
1.0000228.0000134.00000.2000
1.0000245.0000134.00000.1000
1.0000200.0000167.00000.1200
1.0000255.0000125.00000.0700
1.0000130.0000100.00000.0600
1.0000150.0000117.00000.0700
1.0000185.0000115.00000.0500
1.0000170.0000125.00000.0600
1.0000165.0000142.00000.0500
A3=inv(X8'
*X8)*X8'
A3=
-0.9909
0.0032
0.0026
12.0133
X9=[1,170,150,0.07;
1,100,167,0.2;
1,120,133,0.1;
1,160,100,0.05;
1,135,108,0.02;
1,100,117,0.07;
X9=
1.0000170.0000150.00000.0700
1.0000100.0000167.00000.2000
1.0000120.0000133.00000.1000
1.0000160.0000100.00000.0500
1.0000135.0000108.00000.0200
1.0000100.0000117.00000.0700
Y2=X9*A3
Y2=
0.7860
2.1704
0.9427
1.3819
-0.0368
0.4766
附录3表一
NO
6
7
8
9
10
11
12
13
14
15
X1
255
X2
X3
X4
0.3
参考文献
[1]姜启源谢金星叶俊。
数学模型(第三版)北京:
高等教育出版社,2003.8
[2]赵静但琦,数学建模与实验。
北京:
高等教育出版社,2003.6
[3]白厚义回归设计与多元统计分析。
广西:
科学技术出版社,2003.1
[4]
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 胃癌 诊断