数学建模.docx
- 文档编号:11430723
- 上传时间:2023-03-01
- 格式:DOCX
- 页数:13
- 大小:68.73KB
数学建模.docx
《数学建模.docx》由会员分享,可在线阅读,更多相关《数学建模.docx(13页珍藏版)》请在冰豆网上搜索。
数学建模
肝癌手术治疗效果评价
摘要:
本文对肝癌手术预后有影响的10个指标建立了相应的数学模型,并且用某医院提供的具有代表性的20个实验样本对预后影响进行了预测评定。
首先对每个影响因子的等级进行了定量评估,通过多元线性回归方法,对20组数据进行了预处理,得到一套较为粗略的回归参数、置信区间、残差。
剔除随机误差项,通过第二次多元线性回归,得到一组可信度高,F-统计量较高,与X对应的概率较小的回归参数,得到目标方程。
对20个样本的预后影响进行等级估计,定出[1,2,···,10]个等级。
对任意病例输入其指标参数,得到其预后等级。
对于1-5等级的病人预测预后效果较差,不推荐手术治疗;对于6-10等级的病人预测预后效果较好,推荐手术治疗。
模型
不仅对样本的预后进行了预测,得到是否进行手术治疗的结果,而且对其预后影响等级进行了预测,结果为:
7,3,8,7,1,8,7,1,3,4,1,10,4,2,8,1,2,1,6.结论中不包含第18项,可视为偶然误差样本,对样本中未出现的患者患病程度预后影响进行预测,可得到1-10的等级,进而判断是否推荐手术治疗,只要将患者的变革参数输入矩阵A
中,即可得到预后影响的预测结果,划入预后影响等级,我么对某患者食道静脉曲张程度为轻,门脉癌栓为分支,HbsAg呈现阳性,Anti-HCV为阴性,肿瘤部位为全肝,肿瘤大小为7.5cm,肿瘤生长方式为膨胀,肿瘤包膜为子灶突破包膜,肿瘤旁微小子灶为有,术后腹水为少,进行了预测,得到预后等级为7,推荐手术治疗。
关键词:
等级评定多元线性回归残差分析
1.问题的重述
肝癌是我国第二常见的癌症,很多人在发现肝癌时就已经是肝癌中晚期了,而肝癌手术治疗是中晚期肝癌的首选疗法。
选取某医院10年来肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、职业、住址、基本病史、临床体征、恶性肿瘤分类、实验室检验指标、影像学检查等,经过数据预处理,选取其中20个有代表性的样本,选取对预后有影响的l0个指标如表1:
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
DECISION
mid
branch
negative
negative
rightliver
middle
dilation
part
no
less
Y
mid
trunk
positive
positive
rightliver
middle
infiltration
no
have
much
N
serious
no
negative
positive
leftliver
big
dilation
no
no
much
Y
no
no
negative
negative
allliver
verybig
dilation
integrate
no
much
Y
light
branch
positive
positive
rightliver
small
infiltration
integrate
have
no
N
mid
trunk
positive
negative
rightliver
middle
infiltration
part
no
no
Y
light
branch
positive
negative
rightliver
small
infiltration
no
have
much
Y
no
trunk
negative
positive
allliver
big
dilation
part
no
less
N
mid
branch
positive
negative
rightliver
middle
dilation
integrate
have
less
N
no
no
negative
positive
rightliver
verybig
dilation
part
no
no
N
serious
trunk
negative
negative
rightliver
big
infiltration
integrate
have
less
N
light
trunk
positive
negative
allliver
small
dilation
no
no
less
Y
no
no
negative
positive
rightliver
verybig
infiltration
part
no
much
N
no
branch
negative
negative
allliver
verybig
infiltration
integrate
have
no
N
serious
branch
positive
positive
rightliver
big
infiltration
part
have
less
Y
mid
no
negative
positive
rightliver
middle
dilation
integrate
have
much
N
mid
branch
negative
negative
rightliver
middle
dilation
integrate
no
less
N
light
trunk
negative
positive
leftliver
small
infiltration
no
no
no
Y
no
trunk
negative
positive
rightliver
verybig
infiltration
no
no
no
N
no
no
positive
positive
rightliver
verybig
dilation
part
no
less
Y
表1-1处理后样本数据
变量名
变量标示
变量说明
X1
食道静脉曲张
无(no)、轻(light)、中(mid)、重(serious)
X2
门脉癌栓
无(no)、分支(branch)、主干(trunk)
X3
HbsAg
阴性(negative)、阳性(positive)
X4
Anti-HCV
阴性(negative)、阳性(positive)
X5
肿瘤部位
左肝(leftliver)、右肝(rightliver)、全肝(allliver)
X6
肿瘤大小
直径<3cm(small)、3~5cm(middle)、
5~10cm(big)、>10cm(verybig)
X7
肿瘤生长方式
膨胀(dilation)、浸润(infiltration)
X8
肿瘤包膜
完整(integrate)、子灶突破包膜(part)、无(no)
X9
肿瘤旁的微小子灶
无(no)、有(have)
X10
术后腹水
无(no)、少(less)、多(much)
DECISION
预后影响
有(Y)、无(N)
表1-2变量说明
请以预后影响作为评价标准,建立数学模型,对手术的治疗效果进行预测,为病人是否选择手术治疗提供建议。
2.问题的分析
经过预处理后,仍存在10个指标对预后有影响,且影响因子变量离散存在,预后影响离散存在。
首先对影响因子变量进行定量评估,对预后进行等级评估,通过初次多元线性回归,剔除随机误差较大的项,通过再次多元线性回归,得到预后影响与指标变量的函数关系。
3.模型的假设及符号说明
3.1模型的假设
⑴各影响因子之间相关程度很低,做多元线性回归时不考虑交叉项;
(2)通过查阅医疗常识,表中便量指标的等级递变;
3.2符号说明(再加一个预后等级N)
X1
食道静脉曲张程度
X2
门脉癌栓
X3
HbsAg
X4
Anti-HCV
X5
肿瘤部位
X6
肿瘤大小
X7
肿瘤生长方式
X8
肿瘤包膜
X9
肿瘤旁的微小灶子
X10
术后腹水
Y
预后影响
X(m,n)
Xm对第n个预后的影响
βi
第i个影响因子的回归系数
B
回归系数矩阵
表3-1符号说明
4.模型的建立和求解
4.1模型的建立
影响程度Y与Xi的多元线性回归模型为:
Y=XB+ε
B—待回归的系数矩阵;
ε—随机误差;
X—影响指标矩阵;
Y—预后影响矩阵.
4.2模型的求解
⑴将便量指标定量估计,
根据基本假设
(2)由于病变程度和预后影响成线性相关可将病变程度和预后影响进行如下的定量处理:
X1
1(no)
2(light)
3(mid)
4(serious)
X2
1(no)
2(branch)
3(trunk)
X3
1(negative)
2(positive)
X4
1(negative)
2(positive)
X5
1(leftliver)
2(rightliver)
3(allliver)
X6
1(small)
2(middle)
3(big)
4(verybig)
X7
1(dilation)
2(infiltration)
X8
1(integrate)
2(part)
3(no)
X9
1(no)
2(have)
X10
1(no)
2(less)
3(much)
Y
10(yes)
0(no)
则变量矩阵为
X=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1;3,3,4,1,2,3,2,1,3,1,4,2,1,1,4,3,3,2,1,1;2,3,1,1,2,3,2,3,2,1,3,3,1,2,2,1,2,3,3,1;1,2,1,1,2,2,2,1,2,1,1,2,1,1,2,1,1,1,1,2;1,2,2,1,2,1,1,2,1,2,1,1,2,1,2,2,1,2,2,2;2,2,1,3,2,2,2,3,2,2,2,3,2,3,2,2,2,1,2,2;2,2,3,4,1,2,1,3,2,4,3,1,4,4,3,2,2,1,4,4;1,2,1,1,2,2,2,1,1,1,2,1,2,2,2,1,1,2,2,1;2,3,3,1,1,2,3,2,1,2,1,3,2,1,2,1,1,3,3,2;1,2,1,1,2,1,2,1,2,1,2,1,1,2,2,2,1,1,1,1;2,3,3,3,1,1,3,2,2,1,2,2,3,1,2,3,2,1,1,2]';
Y=[10,0,10,10,0,10,10,0,0,0,0,10,0,0,10,0,0,10,0,10];
利用matlab计算回归系数及置信区间,根据分析作残差图:
参数
参数估计值
置信区间
β0
4.9903
【-21.9445,1.9251】
β1
2.1724
【1.6846,6.0293】
β2
-4.1558
【-9.7969,1.4853】
β3
2.6274
【-3.5746,8.8294】
β4
-3.1383
【9.3131,3.0365】
β5
2.7356
【6.0146,11.4858】
β6
-0.9019
【-4.0467,2.2430】
β7
2.5958
【-4.7312,9.9228】
β8
3.4736
【-1.3890,8.3362】
β9
-5.4983
【13.4548,2.4581】
β10
-1.0210
【-5.3874,3.3453】
R2=0.783F=67.8P=0.074
表4-1残差分析表
图4-1残差图
⑵模型优化
从残差图4-1可以看出除第18组数据外,其余数据的残差离零点均较近,且残差置信区间包含零点。
但置信度和决定系数均较低,将第18组数据定义为误差组,提出后,对预后进行等级估计,通过查阅文献和主观估计,可将预后恢复概率决定其预后的等级则:
A=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1;3,3,4,1,2,3,2,1,3,1,4,2,1,1,4,3,3,1,1;2,3,1,1,2,3,2,3,2,1,3,3,1,2,2,1,2,3,1;1,2,1,1,2,2,2,1,2,1,1,2,1,1,2,1,1,1,2;1,2,2,1,2,1,1,2,1,2,1,1,2,1,2,2,1,2,2;2,2,1,3,2,2,2,3,2,2,2,3,2,3,2,2,2,2,2;2,2,3,4,1,2,1,3,2,4,3,1,4,4,3,2,2,4,4;1,2,1,1,2,2,2,1,1,1,2,1,2,2,2,1,1,2,1;2,3,3,1,1,2,3,2,1,2,1,3,2,1,2,1,1,3,2;1,2,1,1,2,1,2,1,2,1,2,1,1,2,2,2,1,1,1;2,3,3,3,1,1,3,2,2,1,2,2,3,1,2,3,2,1,2]';
Y=[7,2.10,8,-1,10,8,-2,2,3,-1,12,3,1,10,0,3,-1,7];
参数
参数估计值
置信区间
β0
-11.2849
【-21.9445,1.9251】
β1
3.9234
【1.6846,6.0293】
β2
-5.7408
【-9.7969,1.4853】
β3
4.4557
【-3.5746,8.8294】
β4
-3.0894
【9.3131,3.0365】
β5
6.9248
【6.0146,11.4858】
β6
0.1939
【-4.0467,2.2430】
β7
2.6079
【-4.7312,9.9228】
β8
3.8424
【-1.3890,8.3362】
β9
-5.3380
【13.4548,2.4581】
β10
-1.328
【-5.3874,3.3453】
R2=0.9899F=78.43P=0.000
图表4-2优化后的残差分析表
从表中R2=0.9899,即因变量的98.99%可由模型确定,F值超过F检验的临界值,P远小于α,因而模型从整体来看是可用的。
其中:
B=[-11.2849,3.9234,-5.7408,4.4557,-3.0894,6.9248,0.1939,2.6079,3.8424,-5.3380,-1.3228];
则目标函数Y=XB
我们选取病变程度最低的一组和病变程度最高的一组作为预后影响等级的上下界,其他的处于其间,
病变程度最高的一个组合为,定义等级为1:
X=[1,4,3,2,2,3,4,2,3,2,3];
Y=XB
Y=-2.3239
病变程度最高的一组合为:
定义等级为10
X=[1,1,1,1,1,1,1,1,1,1,1];
Y=12.4752,
可将目标函数做如下处理得到预后等级
y=[(Y+2.3239)×(12.4752+2.3239)×10]
N为对y取模
(3)模型检验
变量矩阵:
A=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1;3,3,4,1,2,3,2,1,3,1,4,2,1,1,4,3,3,1,1;2,3,1,1,2,3,2,3,2,1,3,3,1,2,2,1,2,3,1;1,2,1,1,2,2,2,1,2,1,1,2,1,1,2,1,1,1,2;1,2,2,1,2,1,1,2,1,2,1,1,2,1,2,2,1,2,2;2,2,1,3,2,2,2,3,2,2,2,3,2,3,2,2,2,2,2;2,2,3,4,1,2,1,3,2,4,3,1,4,4,3,2,2,4,4;1,2,1,1,2,2,2,1,1,1,2,1,2,2,2,1,1,2,1;2,3,3,1,1,2,3,2,1,2,1,3,2,1,2,1,1,3,2;1,2,1,1,2,1,2,1,2,1,2,1,1,2,2,2,1,1,1;2,3,3,3,1,1,3,2,2,1,2,2,3,1,2,3,2,1,2]';
B=[-11.2849,3.9234,-5.7408,4.4557,-3.0894,6.9248,0.1939,2.6079,3.8424,-5.3380,-1.3228];
预后影响等级
预后影响
1
7
Y
2
3
N
3
8
Y
4
7
Y
5
1
N
6
8
Y
7
7
Y
8
1
N
9
3
N
10
4
N
11
1
N
12
10
Y
13
4
N
14
2
N
15
8
Y
16
1
N
17
2
N
19
1
N
20
6
Y
表
由数据可见,除第18组数据外,都与实验复合,并且得出预后效果的好坏程度,对于任意给定的患者情况皆,只需要输入患者的信息,例如:
某患者食道静脉曲张程度为轻,门脉癌栓为分支,HbsAg呈现阳性,Anti-HCV为阴性,肿瘤部位为全肝,肿瘤大小为7.5cm,肿瘤生长方式为膨胀,肿瘤包膜为子灶突破包膜,肿瘤旁微小子灶为有,术后腹水为少,则可以得到变量指标矩阵为
X=[1,1,2,2,1,3,3,1,2,2,1],
则Y=X*CT
Y=6.6618
则预后影响等级为7,推荐该患者接受手术治疗。
5.模型的评价和改进
5.1模型的评价
5.1.1优点
本模型主要讨论了10个变量指标对肝癌手术预后影响的相关问题。
我们应用了等级评定,多元线性回归,残差分析等数学方法建立了关于变量指标和预后影响因子的函数关系,实现了对肝癌手术预后影响的预测,总的来说完成了题目的基本要求并建立了较为完善的数学模型。
5.1.2缺点
模型忽略了诸多指标变量之间的相关性,致使对于某些类型的患者的预测出现了偏差。
在指标变量和预后影响等级的评定中加入了主观评定因素,致使对某些肝癌患者的预测出现了偏差。
5.2模型的改进及推广
⑴将10个指标变量进行相关性处理,并将交叉项考虑进去,会提高预测的精确性;
⑵通过对大量样本的预后影响进行统计评估,可减少主观因素的影响。
⑶本模型可以处理其他变量指标与目标选择问题,如:
对环境有一定污染但经济效益可观的工厂是否进行投产等问题。
参考文献
[1]吴孟超,陈汉,姚晓平.原发性肝癌的外科治疗[J].中华外科期刊,1996,34:
707-710.
[2]李华,潘承恩,刘青光,等.根治性切除肝细胞癌预后影响因素分析[J].肝胆外科杂志,2000,8
(2):
90-92
[3]曲强,芮静安,王少斌,等.肝细胞肝癌临床分期系统的比较.中华肿瘤杂志,2006,28:
155-158.
[4]程树群,程红颜,等.原发性肝癌门静脉癌栓生长特征的研究.中国现代普通外科进展,2003,6:
103-105.
[5]姜启源数学模型(第二版)北京:
高等教育出版社,1993.
[6]郭亚军,综合评价理论、方法及应用,北京:
科学出版社,2007.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模