生物信息学应用论文3200字生物信息学应用毕业论文范文模板Word下载.docx
- 文档编号:20687006
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:6
- 大小:20.65KB
生物信息学应用论文3200字生物信息学应用毕业论文范文模板Word下载.docx
《生物信息学应用论文3200字生物信息学应用毕业论文范文模板Word下载.docx》由会员分享,可在线阅读,更多相关《生物信息学应用论文3200字生物信息学应用毕业论文范文模板Word下载.docx(6页珍藏版)》请在冰豆网上搜索。
[关键词]食管鳞癌;
关键基因;
生物信息学;
基因芯片
根據WHO统计,全世界每年约有40万人死于食管癌,其中我国约20万人,占世界的一半[1]。
食管癌主要有两个亚型——食管鳞癌和腺癌,我国食管癌患者主要为鳞癌。
目前食管癌的发生发展及转移机制尚不清楚,因此进一步研究其发病机制,建立有效的预防和诊疗方法,是迫切需要解决的问题。
本研究通过分析GEO数据库[2]中食管鳞癌的相关芯片数据,旨在挖掘食管鳞癌的关键基因,利用生物信息学方法探讨其可能的发病机制,为进一步的基础与临床研究提供方向。
1资料与方法
1.1一般资料
资料来源GEO在线数据库,下载食管鳞癌全基因组表达谱芯片数据集。
入选条件:
①全基因组RNA表达谱芯片;
②人食管鳞癌组织与配对的癌旁正常组织。
1.2方法
1.2.1分析差异表达基因①数据预处理:
将下载的芯片数据导入R语言,经RMA法进行背景校正和矩阵数据归一化处理获得标准化芯片表达矩阵数据;
②筛选差异表达基因:
使用“Limma”包[3]筛选差异倍数(FC)>
2且P<
0.01的数据作为有意义的差异表达基因,并使用“ggplot”包绘制火山图。
1.2.2共同差异表达基因将筛选出的各个基因芯片数据集的差异表达基因取交集,获得共同的差异表达基因。
1.2.3GO与KEGG通路富集分析将共同差异表达基因导入DAVID6.8分析工具[4],进行GO与KEGG通路富集分析[5],条件设定为P<
0.01,结果使用“ggplot2”包[6]绘制气泡图。
1.2.4PPI网络构建与关键基因分析将筛选出的共同差异表达基因通过数据库String11.0进行蛋白互作PPI网络分析,结果导入Cytoscape软件的CytoHubba插件[7],获取链接度最高的10个Hub基因。
1.2.5关键基因验证通过GEPIA[8]网站,验证这10个Hub基因在TCGA和GTEx[9]数据库的表达情况,确定食管鳞癌的关键基因。
2结果
2.1食管鳞癌芯片数据集筛选
通过GEO数据库共筛选出符合条件的数据集三组,分别为GSE23400[10]、GSE20347[11]和GSE17351[12],样本均为食管鳞癌及其配对癌旁正常食管黏膜组织。
见表1。
表1食管鳞癌基因表达谱芯片数据集基本信息
2.2差异表达基因分析
分析各组芯片数据集差异倍数FC>
0.01的差异表达基因。
见表2、图1。
表2食管鳞癌基因表达谱芯片数据集DEGs分析结果(个)
2.3共同差异表达基因
对三组数据集差异表达基因进行Venn交集[13],共获得204个共同差异表达基因,其中上调的167个,下调的37个。
见图2。
2.4GO富集分析
将共同差异表达基因导入DAVID6.8进行GO富集分析,发现食管鳞癌共同差异表达基因主要富集在细胞分裂、细胞周期、有丝分裂等163个生物过程中;
主要位于细胞质、细胞器腔内、细胞核等48个细胞学组分中;
主要参与调控肽酶活性,与细胞外基质、结构特异性DNA结合等46个分子功能。
取统计学意义最为显著(P值最小)的前15个。
见图3(封三)。
2.5KEGG通路富集分析
共同的差异表达基因在KEGG通路方面主要富集在小细胞肺癌、癌症通路、局部黏附、细胞周期、DNA复制等12个条目中(图4,封三)。
2.6Hub基因筛选
通过分析工具String11.0对这些共同的差异基因构建PPI网络,再利CytoHubba插件,对其互作关系进行MCC算法分析,得到链接度最高的10个Hub基因(图5)。
链接度由高至低分别为CDK1、CCNA2、RFC4、CCNB1、TOP2A、AURKA、CDC6、BUB1、BUB1B、PLK1。
2.7关键基因在公共数据库中的验证
将筛选出的10个Hub基因通过GEPIA2网站验证,显示在TCGA和GTEx数据库中,相对于食管癌旁正常组织,10个基因在食管癌组织中均呈高表达状态(P<
0.01)(图6),说明其是食管癌的关键差异基因。
3讨论
本研究分析GEO数据库中3个食管鳞癌全基因表达谱芯片数据,发现相对于配对正常食管黏膜组织,共有204个差异基因为3个芯片数据集共有。
对其进行GO功能注释发现其与细胞周期、有丝分裂、细胞黏附等生物学过程相关。
KEGG通路富集分析表明食管鳞癌与小细胞肺癌、膀胱癌可能具备相同的分子机制,提示其与细胞周期、局部黏附、p53信号通路等机制相关。
分析以上结果,发现GO与KEGG通路富集分析均提示细胞周期和细胞黏附可能与食管癌密切相关。
细胞周期与恶性肿瘤发生关系密切,细胞周期调控紊乱可以导致细胞失控性增殖,这也是恶性肿瘤最基本的生物学特征[14]。
p53信号通路参与细胞周期调控,诱导G1、G2期阻滞,这与肿瘤的发生、发展密切相关。
细胞黏附在肿瘤侵袭转移过程中发挥重要作用,肿瘤细胞发生黏附特性的改变,使其易从原位细胞群中解黏附脱离出来,进入血液和淋巴循环系统,同时也使肿瘤细胞到达靶器官后,更容易与靶器官的基质黏附[15]。
所以通过公共数据库进行大数据挖掘与分析,为肿瘤发病机制的研究提供方向与思路是可行的。
通过构建PPI网络,得到10个核心差异基因:
CDK1、CCNA2、RFC4、CCNB1、TOP2A、AURKA、CDC6、BUB1、BUB1B、PLK1。
10个基因中,除RFC4、BUB1、BUB1B基因未见报道外,其余均已有相关报道。
CDK1在细胞周期中介导细胞从G2期进入M期,是参与细胞有丝分裂的主要因子[16]。
CDK1也是食管癌及癌前病变的诊断、预后标志物和潜在治疗靶点[17]。
CCNA2与CCNB1与CDK激酶相互作用,参与细胞周期调控[18]。
TOP2A在调节细胞周期和调节肿瘤增殖中起着重要作用,是各种肿瘤进展和预后的潜在生物标志物[19]。
AURKA是细胞周期正常发生的必需蛋白,该基因的突变与多种类型癌症发生有关,AURKA在乳腺癌、结肠直腸、前列腺癌等几种细胞系中过表达[20]。
本研究进一步验证了这10个基因在TCGA数据库中的表达情况,结果显示其在食管癌样本中全部高表达,表明它们可能是食管鳞癌的生物标志物。
虽然本项研究是一种倾向性研究,最终需要大量实验数据的证实,但也为食管癌的发病机制研究提供了基础信息和新的研究方向。
生物信息学应用毕业论文范文模板
(二):
循证医学中的生物信息学应用及教学初步探讨论文
摘要:
循证医学和生物信息学是两个新兴的独立学科。
随着大数据技术和精准医学的发展,循证医学与生物信息学的交叉融合将会产生“新医科”或者“新理工科”。
同时,生物信息学在循证医学中的应用使得其研究范式也有了很大转变。
本文对生物信息学在循证医学研究中应用现状进行了总结,并做出了展望。
根据调研结果,我们对循证医学中的生物信息学教学进行了初步探讨。
关键词:
Meta分析组学数据库专业教育
中图分类号:
R-05文献标识码:
A文章编号:
1674-098X(2019)09(c)-0224-03
1循证医学与生物信息学
循证医学是20世纪90年代发展起来的新兴医学学科,自从诞生以来,从传统医学逐步拓展到当代医学的各个领域,是经验医学向以客观证据为决策依据的当代医学转变的关键方式[1]。
国际循证医学组织1992年首次对其做出了明确的定义:
“循证医学是系统检索、评价和使用当前可得到的研究发现,将其作为临床决策依据的过程”[2]。
此定义突出了医学证据的系统评价的重要性,也说明了医生应该全面的,运用现有的科学研究手段认真的搜集证据来指导诊疗患者。
目前循证医学已经广泛得到了科学界的认可,其中荟萃(Meta)分析和系统性评论已成为循证医学中的重要分析手段[3]。
另一方面,生物信息学基于生物医学大数据,以研究生物信息的采集、存储、处理、解读为目的,综合应用计算机和数理统计等方法和技术,全面地解读生命的奥秘[4]。
医学的发展,芯片、高通量测序、质谱等各种诊疗手段的出现,由此而产生的医学尤其是生物医学相关大数据爆炸性的增长[5]。
海量的生物医学数据蕴含着巨大的宝藏,如何挖掘其中的价值,寻找新的研究证据,成为医务研究工作者不可避免的问题。
应用生物信息中多组学相关的技术对已发表的数据库中的实验和临床数据进行深度挖掘,全方位的解讀生物医学数据,同时结合样本的临床数据,可以为临床诊疗提供深度、可靠决策依据。
所以,生物信息学已经逐步发展为现代医学的关键技术方法[6]。
循证医学的研究范式正在发生深刻的变革,生物信息学将为挖掘多层次临床与研究数据提供有力的技术手段,从而成为循证医学共同决策实践中的一个关键要素(如图1)。
目前,生物信息学在循证医学中的应用才刚刚起步,急需培养一定的专业人才。
针对循证医学的学科性质,如何更加合理进行专业的生物信息学人才的教学和培养值得探讨和研究[7]。
2生物信息学在循证医学中的应用现状
生物信息学在循证医学中的应用现状主要分为两类研究:
基于生物信息学的Meta分析和循证医学相关数据库的构建。
2.1基于生物信息学的Meta分析
Meta分析是一种对不同研究结果进行收集、合并及统计分析的方法,其主要目的是将以往的研究结果整合为更为客观的综合反映出来。
由于多组学研究的蓬勃发展,传统的循证医学研究对象数据有了多样性的发展。
生物信息学技术在Meta分析中的应用一般表现在对于测序数据的整合分析。
其基本思路通常从相关数据库如GEO/TCGA等下载基因表达数据,用常规生物信息学方法进行疾病特异基因差异表达,找出候选基因列表,随后进行Meta分析,并结合传统生物信息学分析方法得出最后结论。
结合Meta分析,我们整合了多种组学数据,包括基因表达谱、MicroRNA芯片以及Chip-Seq的数据,寻找到与神经胶质瘤发生相关的通路[8]。
使用机器学习的方法,用逻辑回归处理微阵列芯片数据得到2×
2表,结合传统的诊断Meta分析,预测CHGA为有效的大肠癌诊断标志物[9]。
2.2循证医学相关数据库的构建
数据库是生物信息学研究的重要组成部分,而随着高通量测序技术及临床电子病历的发展和完善,越来越多的基于生物信息学思想和技术的专业循证医学数据库被建立了起来[10]。
构建循证医学相关数据库,并对数据库进行整合建模分析,可以从数据中获得隐含的先验知识,将为循证医学的研究提供更多的证据支持。
这里推荐一些在国际期刊发表的相关实用数据库:
癌症基因表达Meta分析数据库CancerMA,基因组学实验相关Meta分析数据库AnnotCompute,表达序列数据相关Meta分析数据库CancerEST,微阵列数据相关Meta分析数据库M2DB(。
我们也建立了大肠癌生物标志物数据库CBD,其中收录了所有大肠癌生物标志物的生物医学信息,用户可以直接下载相关数据进行诊断/治疗/预后Meta分析。
3大数据时代下生物信息技术在循证医学领域的发展前景
循证医学伴随着现代医学的发展而深化,在大数据的时代背景下,应用生物信息学挖掘海量的生物医学数据,多学科结合的方式搜集疾病诊疗的依据,能够极大提高和丰富循证医学效能,加快推动循证医学进入个体化医疗时代。
根据Hood博士的“P4医学”理论,随着个人身体特征大数据的积累,我们完全可以利用相关生物信息学的方法来对传统循证医学进行更深入的辅助研究,从而得到更准确/更实际的结论。
疾病预防。
在疾病预防的循证医学研究中,生物信息学具体可应用在:
通过构建疾病相关风险因素数据库及模型,利用大数据来预测未病,帮人们规避负面的生活习惯及环境。
疾病诊断。
在疾病诊断的循证医学研究中,可以通过生物信息学方法分析测序数据,得到2×
2表,进行诊断Meta分析。
疾病治疗。
在疾病治疗的循证医学研究中,可以通过生物信息学方法寻找潜在疾病治疗相关生物标志物,对这些潜在生物标志物进行疾病治疗相关的循证医学研究。
疾病预后。
整合以上三个方面的方法,构建预后相关数据库及模型,对疾病进行有效预后;
通过测序数据寻找预后相关生物标志物,进行预后Meta分析等。
4教学初步探讨
循证医学领域的生物信息学教学最重要的就是要理解循证医学的研究目的,并结合其与生物信息学的交叉特性,培养“循证医学偏倚性”的生物信息学人才。
本文下面将从三个方面对循证医学领域的生物信息学教学提出初步探讨。
4.1针对循证医学的生物信息学教育的师资培养
人才培养,师资先行。
在充分理解交叉学科的特性和定位的基础上,需要建立一支具有循证医学或者医学统计学专业背景的教师,同时还需要参与教学与人才培养的任课老师具有从事生物信息学相关课题研究经验。
在教学实践中,要求教师在教授过程中充分利用循证的思想,将生物信息专业知识与循证医学证据有效的结合起来进行教学决策。
此外,教师应该同时紧跟生物信息学和循证医学发展方向,了解两个领域的前沿动态,并引导学生参与相关的课题研究。
4.2根据循证医学指南进行生物信息学教材编写
在循证医学教育实践中,已经建立了十分明确的证据分级标准和实施步骤,同时大量指导文献,包括指南、手册以及成熟的系统评价,也已被撰写并收录在教育学数据库中,比如Campell协作网、教学资源信息中心(ERIC)等。
从生物信息学的角度,如何将生物信息学的前沿技术与循证医学指南结合起来给医学工作者提供更加与时俱进的研究决策参考。
但是目前生物信息学本身的教材建设都存在着很多不足,所以根据循证医学指南进行生物信息学教材编写是循证医学的生物信息学教育中课程体系的建设的基础,任重而道远。
4.3教学实践中,以前沿生物信息技术为基础,以临床应用为导向
在教学实践中,强调生物医学的培养模式偏向于应用于生物信息学工具解决临床医学研究中的实际问题。
以循证医学中的传统技术手段为基础,比如讲授Meta分析软件的应用,包括Stata、RevMan、R语言等。
以前沿生物信息技术为另一个技术基础,包括各种组学数据分析方法,生物信息学数据库的构建技术,以及临床医学数据的数据统计、数据建模、机器学习等人工智能前沿技术。
生物信息技术的教学目标是满足医生的临床需要,以便其做出决策。
所以在教学过程中还需要培养学生如何在临床实践中学会应用由生物信息学产生的数据信息。
比如应用生物信息学技术将精准医疗所产生的非结构,半结构化的基因或蛋白数据转化为临床使用的结构数据,形成临床医生看的懂的有用信息,从而实现对疾病的精准诊断、治疗和预后。
另外,也要培养临床医务工作者在进行医疗决策过程中,如何系统应用医学搜索工具,相关的专业数据库,以方便循证医学的日常工作的顺利进行。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 应用 论文 3200 毕业论文 范文 模板