微生物群落多样性测序与功能分析Word格式.docx
- 文档编号:14074562
- 上传时间:2022-10-18
- 格式:DOCX
- 页数:23
- 大小:1.68MB
微生物群落多样性测序与功能分析Word格式.docx
《微生物群落多样性测序与功能分析Word格式.docx》由会员分享,可在线阅读,更多相关《微生物群落多样性测序与功能分析Word格式.docx(23页珍藏版)》请在冰豆网上搜索。
operationaltaxonomicunits(OTUs)在微生物的免培养分析中经常用到,通过提取样品的总基因组DNA,利用16SrRNA或ITS的通用引物进行PCR扩增,通过测序以后就可以分析样品中的微生物多样性,那怎么区分这些不同的序列呢,这个时候就需要引入operationaltaxonomicunits,一般情况下,如果序列之间,比如不同的16SrRNA序列的相似性高于97%就可以把它定义为一个OTU,每个OTU对应于一个不同的16SrRNA序列,也就是每个OTU对应于一个不同的细菌(微生物)种。
通过OTU分析,就可以知道样品中的微生物多样性和不同微生物的丰度。
测序区段:
由于16srDNA较长(1.5kb),我们只能对其中经常变化的区域也就是可变区进行测序。
16srDNA包含有9个可变区,分别是v1-v9。
一般我们对v3-v4双可变区域进行扩增和测序,也有对v1-v3区进行扩增测序。
工具/原料
∙16srDNA测序首先需要提取环境样品的DNA,这些DNA可以来自土壤、粪便、空气或水体等任何来源。
∙提取DNA后需要经过质检和纯化,一般16srDNA测序扩增对DNA的总量要求并不高,总量大于100ng,浓度大于10ng/ul一般都可以满足要求。
如果是来自和寄主共生的环境如昆虫的肠道微生物,提取时可能包括了寄主本身的大量DNA,对DNA的总量要求会提高。
微生物菌群多样性测序受DNA提取和扩增影响很大,不同的扩增区段和扩增引物甚至PCR循环数的差异都会对结果有所影响。
因而建议同一项目不同样品的都采用相同的条件和测序方法,这样相互之间才存在可比性。
∙完成PCR之后的产物一般可以直接上测序仪测序,在上机测序前我们需要对所有样本进行定量和均一化,通常要进行荧光定量PCR。
完成定量的样品混合后就可以上机测序。
∙16srDNA测序目前可以采用多种不同的测序仪进行测序,包括罗氏的454,Illumina的MiSeq,Life的PGM或Pacbio的RSII三代测序仪。
不同的仪器各有优缺点,目前最主流的是Illumina公司的MiSeq,因为其在通量、长度和价格三者之间最为平衡。
MiSeq测序仪可以产生2x300bp的测序读长,一次可以产生15Gb的测序数据远远大于其他测序仪的测序通量。
方法/步骤
类到科的OTU数量;
Genus表示分类到属的OTU数量;
Species表示分类到种的OTU数量。
1.4
我们还可以对这些种属的构成进行柱状图显示:
横坐标中每一个条形图代表一个样本,纵坐标代表该分类层级的序列数目或比例。
同一种颜色代表相同的分类级别。
图中的每根柱子中的颜色表示该样本在不同级别(门、纲、目等)的序列数目,序列数目只计算级别最低的分类,例如在属中计算过了,则在科中则不重复计算。
Q:
为什么要选择V3-V4区的测序长度?
为什么有些文献是V6区,有什么区别?
A:
16SrRNA总长约1540bp,包含9个可变区。
由于高通量测序的测序长度的限制,不可能将16SrRNA的9个可变区全部测序,所以在PCR扩增时往往只能选择1-3个可变区作为扩增片段。
Kozich等评估了Miseq测序仪分析的不同16SrRNA可变区的准确性发现,测定V4区效果最佳。
根据我们的测序长度,v3-v4区是最佳选择。
2.5
我们还需要对样本之间或分组之间的OTU进行比较获得韦恩图:
注意,韦恩图目前一般最多只能显示5个样本或分组,过多的样本无法无法进行韦恩图绘制
3.6
样品构成丰度:
稀释曲线
微生物多样性分析中需要验证测序数据量是否足以反映样品中的物种多样性,稀释曲线(丰富度曲线)可以用来检验这一指标。
稀释曲线是用来评价测序量是否足以覆盖所有类群,并间接反映样品中物种的丰富程度。
稀释曲线是利用已测得16SrDNA序列中已知的各种OTU的相对比例,来计算抽取n个(n小于测得reads序列总数)reads时出现OTU数量的期望值,然后根据一组n值(一般为一组小于总序列数的等差数列)与其相对应的OTU数量的期望值做出曲线来。
当曲线趋于平缓或者达到平台期时也就可以认为测序深度已经基本覆盖到样品中所有的物种;
反之,则表示样品中物种多样性较高,还存在较多未被测序检测到的物种。
下图中的稀释曲线
横坐标代表随机抽取的序列数量;
纵坐标代表观测到的OTU数量。
样本曲线的延伸终点的横坐标位置为该样本的测序数量,如果曲线趋于平坦表明测序已趋于饱和,增加测序数据无法再找到更多的OTU;
反之表明不饱和,增加数据量可以发现更多OTU。
4.7
Shannon-Winner曲线
Shannon-Wiener曲线,是利用shannon指数来进行绘制的,反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。
当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息。
与上图一样,横坐标代表随机抽取的序列数量;
纵坐标代表的是反映物种多样性的Shannon指数。
其中曲线的最高点也就是该样本的Shannon指数,指数越高表明样品的物种多样性越高。
Shannon指数怎么算的?
Shannon指数公式:
其中,Sobs=
实际测量出的OTU数目;
ni=
含有i条序列的OTU数目;
N
=
所有的序列数。
5.8
Rank-Abundance曲线
用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。
物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;
物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。
一般超过20个样本图就会变得非常复杂而且不美观,所以一般20个样本以下会做该图,图片保存为结果目录中rank.pdf。
横坐标代表物种排序的数量;
纵坐标代表观测到的相对丰度。
样本曲线的延伸终点的横坐标位置为该样本的物种数量,如果曲线越平滑下降表明样本的物种多样性越高,而曲线快速陡然下降表明样本中的优势菌群所占比例很高,多样性较低。
6.9
Alpha多样性(样本内多样性)
Alpha多样性是指一个特定区域或者生态系统内的多样性,常用的度量指标有Chao1丰富度估计量(Chao1richnessestimator)、香农-威纳多样性指数(Shannon-wienerdiversityindex)、辛普森多样性指数(Simpsondiversityindex)等。
计算菌群丰度:
Chao、ace;
计算菌群多样性:
Shannon、Simpson。
Simpson指数值越大,说明群落多样性越高;
Shannon指数越大,说明群落多样性越高。
表中显示前10个样本,如果样本大于10个,详见结果目录中的alpha_div.txt。
能不能解释下每个指数(如chao1、shannon)?
Chao1:
是用chao1算法估计群落中含OTU数目的指数,chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。
Chao1值越大代表物种总数越多。
Schao1=Sobs+n1(n1-1)/2(n2+1)
其中Schao1为估计的OTU数,Sobs为观测到的OTU数,n1为只有一条序列的OTU数目,n2为只有两条序列的OTU数目。
Shannon:
用来估算样品中微生物的多样性指数之一。
它与Simpson多样性指数均为常用的反映alpha多样性的指数。
Shannon值越大,说明群落多样性越高。
Ace:
用来估计群落中含有OTU数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。
Simpson:
用来估算样品中微生物的多样性指数之一,由EdwardHughSimpson(1949)提出,在生态学中常用来定量的描述一个区域的生物多样性。
Simpson指数值越大,说明群落多样性越高。
辛普森多样性指数=随机取样的两个个体属于不同种的概率
=1-随机取样的两个个体属于同种的概率
7.10
Beta多样性分析(样品间差异分析)
Beta多样性度量时空尺度上物种组成的变化,
是生物多样性的重要组成部分,
与许多生态学和进化生物学问题密切相关,
因此在最近10年间成为生物多样性研究的热点问题之一。
PCoA分析
PCoA(principalco-ordinatesanalysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。
通过PCoA可以观察个体或群体间的差异。
每一个点代表一个样本,相同颜色的点来自同一个分组,两点之间距离越近表明两者的群落构成差异越小。
PCoA有多张图,分别代表的PCoA1-2,2-3,3-1。
8.11
NMDS分析(非度量多维尺度分析)
NMDS(NonmetricMultidimensionalScaling)常用于比对样本组之间的差异,可以基于进化关系或数量距离矩阵。
横轴和纵轴:
表示基于进化或者数量距离矩阵的数值在二维表中成图。
与PCA分析的主要差异在于考量了进化上的信息。
9.12
PCA分析
主成分分析PCA(Principalcomponentanalysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要的前几位特征值,采取降维的思想,PCA可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 微生物 群落 多样性 功能分析