高教社杯全国大学生数学建模竞赛.docx
- 文档编号:2130971
- 上传时间:2022-10-27
- 格式:DOCX
- 页数:23
- 大小:421.34KB
高教社杯全国大学生数学建模竞赛.docx
《高教社杯全国大学生数学建模竞赛.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛.docx(23页珍藏版)》请在冰豆网上搜索。
高教社杯全国大学生数学建模竞赛
2006高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
B
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
天津商学院
参赛队员(打印并签名):
1.孙尔雁
2.傅高基
3.刘品超
指导教师或指导教师组负责人(打印并签名):
安建业
日期:
2006年9月18日
赛区评阅编号(由赛区组委会评阅前进行编号):
2006高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
艾滋病疗法的评价及疗效的预测
摘要:
考虑到艾滋病患者对药物疗效的差异,本文将按特定的标准运用聚类分析的方法将艾滋病患者分成不同的群体,针对不同的患者群体分别运用曲线拟合的方法,得到了最佳治疗终止时间,对继续治疗的效果可进行预测。
对问题
(1):
首先利用SPSS中回归分析预测的方法,对附件1中缺失数据进行补缺;然后对CD4的浓度作对数变换ln(CD4的浓度+1),将ln(CD4的浓度+1)与HIV的浓度的比值作为衡量疗效的变量;其次依据所得到的比值利用SPSS软件中聚类分析的方法,把艾滋病患者分成五类群体,将每类患者的疗效变量对时间进行三次曲线拟合,最后得到五类患者的最佳治疗时间如下表所示:
类型
1
2
3
4
5
最佳治疗终止时间(周)
27.3
15.7
37.4
23.8
18.0
对问题
(2):
首先将对附件2中严重缺失CD4浓度数据的患者进行删除;然后根据艾滋病患者的年龄将患者分为六类,在每个年龄类内讨论各个疗法的疗效;其次就每类群体用CD4的浓度对治疗时间用SPSS软件进行三次曲线拟合,最后得到第40周时六类不同年龄段患者的最佳治疗方案如下表所示:
年龄段
14.9021
~24.9021
24.9021
~34.9021
34.9021
~44.9021
44.9021
~54.9021
54.9021
~64.9021
64.9021
~74.58
最佳疗法
四
四
四
四
四
二
最佳疗法的疗效或终止治疗时间(周)
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
27.7周后停止此疗法治疗
对问题(3):
在问题
(2)的基础上,将同时考虑停止治疗时间及治疗费用两个因素,对六个不同年龄段的患者分别运用整数非线性规划建模的方法,借助于Lingo软件,对问题
(2)的最佳治疗方案重新研究,得到了第40周时相应的最佳治疗方案如下表:
年龄段
14.9021
~24.9021
24.9021
~34.9021
34.9021
~44.9021
44.9021
~54.9021
54.9021
~64.9021
64.9021
~74.58
最佳疗法
三
一
一
一
三
一
最佳疗法的疗效或终止治疗时间(周)
建议40周后用此方法继续治疗
31.77周后停止此疗法治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
建议40周后用此方法继续治疗
关键词:
曲线拟合,聚类分析,整数非线性规划,回归分析预测.
一问题重述
艾滋病的英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV)引起的。
这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从1981年发现以来,已经吞噬了近3000万人的生命。
人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。
治疗艾滋病的目的就是是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。
不过,到目前为止人类还没有找到能根治AIDS的疗法。
近年来,由于对HIV感染的发病原因有了更多的了解,人们虽然研制出更有效的新药,但一些AIDS疗法不仅对人体有副作用,而且成本也很高。
许多国家和医疗组织都在积极试验、进一步寻找更好的AIDS疗法。
现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据,依此研究下列问题,为治疗艾滋病患者提供有效参考:
(1)附件1的数据是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。
利用这些数据预测继续治疗的效果,或者确定最佳治疗终止时间;
(2)附件2的数据是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。
4种疗法的日用药分别为:
600mgzidovudine或400mgdidanosine(去羟基苷),这两种药按月轮换使用;600mgzidovudine加2.25mgzalcitabine(扎西他滨);600mgzidovudine加400mgdidanosine;600mgzidovudine加400mgdidanosine,再加400mgnevirapine(奈韦拉平)。
利用这些数据评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间;
(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:
600mgzidovudine1.60美元,400mgdidanosine0.85美元,2.25mgzalcitabine1.85美元,400mgnevirapine1.20美元。
如果病人需要考虑4种疗法的费用,对
(2)中的评价和预测(或者提前终止)有什么改变。
二基本假设及符号说明
1.基本假设:
不考虑体质、性别、年龄等因素对患者服药后体内CD4细胞含量与HIV细胞含量产生的影响。
2.符号说明:
NDcd4:
艾滋病患者体内CD4的浓度;
NDhiv:
艾滋病患者体内HIV的浓度;
LX(i):
第i类患者服药后的疗效,;
T(i):
第i类或第i个年龄段的患者治疗的时间(单位:
周),;
NDcd4:
(i)第i个年龄段患者服药后艾滋病患者体内CD4的浓度,;
a(i):
分别对应第i种疗法的患者服药时间(i=1,2,3,4);
mm(i):
分别对应第i种疗法的日服药费用(i=1,2,3,4);
t(i)代表是否使用第i种疗法治疗(i=1,2,3,4).
三建立模型及求解
1.模型一
1.1问题分析
因附件1给的数据是一组实际值,就有必要对数据进行填补缺失数值及剔除异常数值的处理。
由于HIV的浓度单位不详,而CD4的浓度与HIV的浓度两者数据的差异较大,为克服这种单位数量级别的影响,对CD4浓度作对数变换;另外,因为CD4与HIV两者都影响着疗效,所以在模型中可用CD4与HIV浓度的比值来表示服药后的疗效,比值越大,疗效越显著。
此外,基于不同患者对同一疗法的疗效有不同的差异,因此有必要对患者分为不同的患者群体分别加以研究。
1.2建模及求解
1.2.1数据准备
第1步填补附件1中必要的缺失数据:
数据缺失无疑会对数据分析的准确性和合理性造成损失,利用数学方法补缺数据通常有两种方法,其一为删除含有漏失数据的个案,其二为用一定的数据方法得到缺失值的替换值,将缺失的数据补起来。
因为所给数据的总量相对较少(个),而缺少部分数据的数据项相对较多(个),所以我们采用第二个方法来处理缺失数据。
附件1中的缺失值包含两种情况:
一是缺少零周时的初始体测值(因为后面我们将利用这些患者的零周体测值进行聚类),一是缺少部分其他值,即例如在某时期只测了CD4的浓度值而没有测HIV的浓度值或只测了HIV的浓度值而没有测CD4的浓度值。
下面我们利用SPSS统计软件[1]中的回归分析预测的方法来找出缺失值的替代值。
其补缺数据的处理结果(见附录1-1)。
第2步在附录1-1的基础上对CD4的浓度作对数变换,并计算的值,其详细结果见。
第3步对患者进行聚类分析,分成五个群体:
在对患者利用聚类的方法进行分类时,由于不同的患者的身体状况不同,进而对药物的反映也不尽相同,表现在患者体内的CD4细胞含量与HIV细胞含量不同。
为了达到聚类统一性,我们将以为主要因素进行分类。
利用SPSS软件,将患者分为7类,其中因第1类和第6类中的患者人数太少(分别为1和2),故将其予于剔除,最后将患者分为5类。
第4步按分类汇总求平均值:
对患者分类后,只需求出各自分类的随着时间改变的变化趋势,就可完成问题一。
但是在各个分类中,不同的患者在同一时间点具有不一样的值,这就需要在前面分类的基础上按各个时间点求平均值,即分类汇总求平均值的方法,进而通过这些值得到各类相应的一条拟合曲线,由此可判断患者是否适合继续服药。
经过上述4步处理后附件1的的数据见(附录1-2),其部分数据结构如下表所示:
ptid
cd4date
cd4count
NDcd4
madate
NDhiv
聚类
23424
0
178
5.1817836
0
5.5
0.942142
7
23424
4
228
5.4293456
4
3.9
1.39214
7
23424
8
126
4.8362819
8
4.7
1.028996
7
23424
25
171
5.1416636
25
4
1.285416
7
23424
40
99
4.5951199
40
5
0.919024
7
23425
0
14
2.6390573
0
5.3
0.497935
2
1.2.2模型建立
将作为衡量疗效LX(i)()好坏的标准,对五类患者群体进行三次曲线拟合,可得:
,
1.2.3模型求解
利用VBA编程(见附录1-3)实现对各时期平均值的进行提取,再利用SPSS统计软件进行曲线拟合,相应的拟合及检验数据如下:
第一类(ratio初始值的中心值为-1.310945):
Independent:
DATE1
DependentMthRsqd.f.FSigfb0b1b2b3
VATIO1CUB.05235.64.593.75
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高教 全国大学生 数学 建模 竞赛