项目申报书国创.docx
- 文档编号:4189474
- 上传时间:2022-11-28
- 格式:DOCX
- 页数:8
- 大小:67.93KB
项目申报书国创.docx
《项目申报书国创.docx》由会员分享,可在线阅读,更多相关《项目申报书国创.docx(8页珍藏版)》请在冰豆网上搜索。
项目申报书国创
项目申报书(国创)
LT
申请经费(范围2000-1000元)
5600
项目完成时间
2014.11
申请人(团队)
姓名
学号
性别
身份证号码
专业班级
手机
王睿然
03121366
男
370705************
031214班
187********
383413378@
李德江
03121365
男
130********3101113
031214班
183********
946605378@
杨静雯
03121319
女
220106************
031214班
187********
545373219@
一、项目组成员情况介绍(包括自身具备的知识条件,有何特长、兴趣,参加哪些科技事件创新活动等)
王睿然:
大学二年级学生,有较扎实的算法基础,对算法类知识有着浓厚的兴趣,尤其爱好数学。
参加过数模校赛;有较好的数学功底,参加过今年的全国大学生数学竞赛,获得参加决赛资格(2014年3月份比赛);对硬件感兴趣,参加过星火杯,与队友一起研发了单片机智能避障小车;能熟练使用matlab、lingo等编程软件,能够熟练运用C语言。
英语水平高,有较高的阅读英文文档的能力。
学习成绩突出,多次获得校级奖学金。
李德江:
大学二年级学生,担任班长职务,积累了丰富的协调管理经验。
掌握了线性代数、离散数学、数据结构、C语言等一系列与程序相关的知识,拥有良好的学习习惯和研究热情,积累了一定的计算机编程能力。
参加了星火杯,研发了单片机避障小车。
杨静雯:
大学二年级学生。
长期关注大量数据处理与分析,具有较为扎实的数学功底,曾参加过ACM校赛,并获得三等奖。
对软件有浓厚的兴趣,参加过星火杯。
具有扎实的C语言,数据结构,线性代数及离散数学功底,多次获得校级奖学金。
对算法有一定深入的研究。
二、项目研究背景(可以是已有的基础,与本项目有关的研究积累和已取得的成绩,已具备的条件,尚缺少的条件及方法等)
单核苷酸多态性(singlenucleotidepolymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,SNP在遗传性疾病的研究中尤其具有重要意义。
随机森林是一个包含多个决策树的机器学习算法,利用随机森林对于SNP研究具有明显优势,适用于处理高维小样本数据,并且基于随机森林的重要性测度对于SNP的分析很有效。
现有的重要性测度对于预测变量之间的关联性分析还有不足,并且由于SNP的连锁不平衡,所以有必要研究新的重要性测度来进行SNP数据的相关分析。
三、国内外的研究现状及研究意义
生命信息的解读和疾病的分子原因发现是国际研究前沿、国家发展战略和重大交叉学科首选的研究领域。
随着人类基因组序列测定的完成和人类单体型图计划(HapMap计划)的实施,基因组序列变异研究,特别是单核苷酸多态性研究,正成为新一轮基因组学的研究重点,其目的是在一定范围内的SNP中找出那些与疾病相关联的SNP子集及其与疾病的关联关系,为进一步的疾病病理分析和生物制药提供依据和基础。
复杂疾病的基因关联研究已成为国际上疾病基因组学、遗传基因组学和计算生物信息学研究的热点,论文数目急剧增长,研究成果不断涌现,比如英国剑桥大学医学研究院Johnson研究组与芬兰国家公共健康中心J.Tuomilehtoy研究组提出的算法以连锁不平衡为基础,如果两SNP间高度连锁,意味着用一个可预测另一个,故只需标记其中的一个;在SNP的标签上,目前已有的工具和系统包括:
由美国南加州大学生物系与美国阿拉巴马大学生物统计系在美国分子与计算生物学计划支持下开发的HapBlock,由美国华盛顿大学基因组科学系开发的Idselect和STAMPA。
我国国家973、国家863和国家自然科学基金等多个层面上都对复杂疾病关联研究给予了支持,其中,北京大学重点研究重大心脏病、中国汉族人群心脏病以及精神分裂症和孤独症的易感基因发现。
2009年,由安徽医科大学第一附属医院教授张学军领衔的研究团队,首次发现了银屑病的“第三个凶手”———LCE基因变异,以及汉族人系统性红斑狼疮的5个易感基因,对阐明疾病发病机制、疾病预警、临床诊断及新药开发具有重大科学价值,这些成果分别发表者国际著名学术期刊《自然•遗传》(在线和期刊发表)上。
四、项目研究的目标及主要内容
研究目标:
提出新的随机森林变量重要性测度,用于识别和筛选SNP,开发相关SNP分析系统,实现简单实用的工具和平台。
主要内容:
1学习随机森林等理论,了解SNP相关分析技术。
2基于最新研究,创新性地提出一种新的随机森林重要性测度方法。
3小组成员分别在模拟数据和真实数据上进行详细测试,并通过测试的结果对方法进行总结与改进。
4制作成相关工具,比如Rpackage等。
5开发相关分析系统,对系统进行测试与评估。
五、项目创新特色概述
提出新的随机森林变量重要性测度方法,使研究既具有重要的研究意义,同时也具有重要的应用价值。
开发出高效的SNP数据分析系统,用于相关致病基因的分析与研究。
六、项目实施方案及实施计划
实施方案:
小组集体学习随机森林,理解其基本原理;在随机森林的基础上,小组分别研究随机森林重要性测度和SNP相关分析技术;小组协助完成适用于SNP相关分析的随机森林重要性测度;对测度进行模拟和真实数据的测试;根据测试结果对方法进行改进;将方法制作成实用的工具,可以用于进一步的理论研究;小组共同完成基于Web的SNP分析系统,用于实际的治病基因的分析研究。
实施计划:
(2013年11月----2013年12月):
项目准备阶段,对相关理论进行学习和总结,进行相关资料收集与整理,对前人的研究进行分析和总结。
(2014年1月----2014年7月):
项目实现阶段,实现重要性测度方法,同时完成Web系统的开发,将方法整合到Web系统中。
(2014年8月----2014年11月):
项目测试阶段,对系统进行测试,根据测试结果进行改进与修正。
七、成员分工情况
(王睿然)项目负责人,项目整体进度把握,算法与系统的整合及工具的开发。
(李德江)主要算法实现以及优化。
(杨静雯)Web系统的开发与测试。
八、预期成果及成果形式
用于重要性测度的高效工具包,以及可以用于SNP分析的Web系统。
建立相关的网络平台。
九、资助经费使用计划(支出项目、计算根据及理由)
实验材料费用:
3200
书籍资料费用:
150
论文发表费用:
2000
专利申请费:
2000
其他:
350
合计:
5600
申请人签名:
年月日
导师
姓名
杨利英
性别
女
出生年月
1974.12
职称/职务
副教授
研究领域
集成学习,生物信息学
所属院系
计算机学院
手机
130********
yangliying1208@
十、指导教师科研项目情况
近三年项目情况:
主持项目:
[1].陕西省科学技术研究发展计划资助项目,基于集成学习的模式识别关键技术研究(2009K01-56),2010~2011
[2].中央高校基本科研业务费项目(K50510030007),集成学习方法研究及其在高维数据分析中的应用,2010.9~2012.12.
[3].中央高校基本科研业务费项目(K5051303017),基于集成学习的基因微阵列数据分类,2013.1~2014.12
参与项目:
[1].国家自然科学基金项目,原因学习:
理论及在全基因组关联分析中的应用(61070137),2011-2013
[2].国家自然科学基金项目,构造可信、高效软件系统的基础研究(60910004),2010.01~2012.12
[3].国家自然科学基金项目,基于FPGA的高可信嵌入式系统的基础研究(91018010),2011.01-2011.12
[4].2009年国家973计划和重大科学研究计划项目(2010CB328100-G),课题2:
信息服务的需求获取与建模
十一、指导教师能否提供实验场地,如何解决实验场地的问题
可以提供实验场地,并且有一台戴尔工作站(DellPrecisionT7600/E5-2630(2.3GHz,6核)*2/8G*8/2T(SATA7.2K)*4/DVDRW/K6001G显卡)用于处理较大的数据。
十二、指导教师意见及具体的指导计划
与各位同学密切合作,至少每周一次针对项目进展情况进行讨论。
指导教师签名:
年月日
十三、评审委员会意见
组长(签字):
年月日
十四、学院意见
负责人(签字):
(公章)
年月日
十五、学校意见
负责人(签字):
(公章)
年月日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 项目 申报 书国创