干货学习|一文解答微生物多样性常见问题

干货学习|一文解答微生物多样性常见问题

5. OTU和ASV分别是什么,我们应该如何选择?

答:扩增子测序是微生物组分析最常用的手段,分析流程也相对比较成熟。扩增子测序分为两个步骤:PCR扩增和测序。这两个步骤都会带来碱基错配,从而导致最后测序数据里面存在比较多的错误。如果一条特定的序列代表了一个微生物,那么存在错误的序列就会造成假阳性。OTU和ASV是解决这一问题应用最广的两种不同分析策略。

OTU:(1)早期算法,历史悠久,应用较广;(2)OTU聚类算法是将相似性大于97%的序列聚为一类,聚类的原则是将低丰度序列往高丰度的序列上聚类。因为测序错误是随机产生的,所以低丰度的序列可能是测序错误导致的,而高丰度序列被认为是准确率更高的序列,这种算法可以将操作分类单元中包含的碱基错误率控制在1%以内;(3)但是这种方法忽略了真实的微生物序列变化,对于一些高度相似的不同种微生物很可能会被整合到单个OTU中,所以相较于ASV,OTU的物种分辨率更低,可能存在低估样本真实的物种多样性的风险;

ASV:(1)近些年来发展出来的新算法,后起之秀;(2)ASV的方法则不直接进行聚类,它是基于统计学的手段对序列纠错,纠错后的序列称为ASVs(Amplicon Sequence Variants)。该方法引入了扩增和测序错误,来推断样本中的扩增子序列,以低至一个碱基的差异来区分序列,可以最大限度的保留了序列的物种多样性,也可以将ASV变相理解为100%聚类的OTU;(3)与OTU相比,ASV具有更高的分辨率,并显示出更好的特异性和更低的假序列率,这对较低的种属分类水平影响较大,而对较高的分类学水平(门水平)组成的影响较小,ASV能够使得环境因子对微生物群落能够获得更高的解释度,因而对于物种信息更为复杂的环境样品建议采用ASV划分方式;(4)由于基因组内部不同16S rRNA基因拷贝的异质性,可能会有多样性高估偏差;(5)此外,在样本的物种多样性很高且测序数据量或者采样量不足情况下,ASV方法会产生更多的低丰度ASV,在后续分析中默认统一去除单件(即在全部样品中仅出现1次的ASV/OTU),因此ASV方法可能会存在较高的数据损失。

6.为什么同一个物种对应不同的OTU?

答:① 在数据库中,本身就存在相同的物种,不同序列的情况。

② OTU是以97%的相似度去聚类的,即使是相同的物种,序列也有可能有个别碱基的不同,加之设定比对置信区间为80%,注释的时候也都会注释上相同的物种。

7.在计算微生物群落样品之间的距离时,分别基于加权与非加权两种不同的算法绘制出的结果展示图有什么不同?如何进行选择呢?

答:①利用非加权的计算方法,主要比较的是物种的有无,如果两个群体的B多样性越小,则说明两个群体的物种类型越相似;而加权方法,则需要同时考虑物种有无和物种丰度两个层面。

②非加权距离算法对稀有物种比较敏感,而加权距离算法则对丰度较高的物种更加敏感。如果研究的生物学问题与物种的相对丰度信息密切相关,使用加权算法的结果展示可能更为符合;如果研究的生物问题与丰度关系不密切,或者各组的区分与低丰度的 OTUs更为密切,则使用非加权的结果可能更为合适。

8.环境因子的数目过多的时候,如何对环境因子做筛选?

答:在进行环境因子关联分析的时候,通常我们会有很多个不同的环境因子,但不是所有的环境因子都会对微生物群落产生实际的影响,尤其是当环境因子的数目过多的时候,部分无意义的环境因子可能还会影响最终的结果。因此,在进行环境因子关联之前,首先要对这些环境因子进行一个初步的筛选,剔除掉一些无效的因子。

VIF分析是针对所有环境因子进行共线性分析,最后会给出每个环境因子的得分,VIF分析通常以10作为阈值,当VIF得分大于10的时候,通常意义上就认为这个环境因子是无效的,可以从后续的分析中剔除。

9.我们在文章中经常会发现,有些研究使用的是RDA,而有些研究使用的是CCA,那么到底这两种方法如何选择呢?

答:RDA 或 CCA 选择原则:先用 species-sample做 DCA 分析,根据DCA分析结果中的梯度长度指标进行选择,看分析结果中 Lengths of gradient 的第一轴的大小,如果大于4.0,就应选CCA;如果在3.0-4.0之间,选RDA 和CCA 均可;如果小于3.0,RDA 的结果要好于 CCA,即选择RDA。

10. 抽平和不抽平的区别?

答:① 抽平指按照一定数量或样本序列最低数量,将所有样本的序列随机抽取至统一数据量。 简单地说,就是在不同的样本测序数据有差距的时候,保证样本测序序列的均一性;

② 抽平分析对高丰度的菌群影响不大,但对于低丰度的物种影响较大,如果关心低丰度菌群则不建议抽平;如果关心高丰度菌群,则抽不抽平都可以;

③ 另外,有些杂志要求抽平,具体可参考意向杂志的发表的同类文章,关注分析是否抽平,如同类文章几乎都抽平,可推断大概率需要抽平,如没有规律则抽不抽平均可。

您可能还喜欢:

云端启航——云-宏蛋白组学平台震撼上线!

中山大学李文均教授团队在蓝细菌光合作用起源和进化研究中取得重要进展

惊喜亮相!全新科研加速器:定制科研级服务器工作站搭建服务返回搜狐,查看更多

相关文章

广点通一个广告多少钱,广点通投放广告多少钱
365速度发国际大厅

广点通一个广告多少钱,广点通投放广告多少钱

📅 08-21 👁️ 3581
螃蟹哪些地方不能吃图解,吃螃蟹的十大禁忌不能吃什么
方舟生存进化Steam多少钱-方舟生存进化售价一览
365网络股份有限公司总部

方舟生存进化Steam多少钱-方舟生存进化售价一览

📅 08-12 👁️ 9745