在微生物多样性分析中,LEfSe分析自“出生”以来就备受青睐,LEfSe能用于从高维数据中寻找组间差异的biomarker,让您能够识别不同丰度的特征以及相关联的类别。您是否正遇到这样的难题呢?快来欧易云平台,我们已经为您准备好免费便捷的LEfSe在线分析小工具,心动不如行动,马上试试吧!
【资料图】
功能介绍
LEfSe分析即LDA Effect Size分析,是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。
原理介绍
A.首先在多组样本中采用的非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种;
B.再利用Wilcoxon秩和检验检查在显著差异物种在分组亚组之间是否都趋同于同一分类 (如果存在分组亚组时);
C.最后用线性判别分析(LDA)对数据进行降维和评估差异显著的物种的影响力(即LDA score)(也可以利用支持向量机分析)。
文件要求
(请严格按照示例文件格式进行上传)
01
层次丰度文件
第一列为物种名,随后为样本分析名,各列对应值为物种在样本中的相对丰度,每组必须有生物学重复,且不少于3个样本(支持txt、xls、xlsx、csv 格式)。
图1 | 层次丰度文件格式示例图
02
样本分组信息文件
第一列为样本分析名,第二列为样本的分组名称,每组必须有生物学重复,且不少于3个样本(支持txt、xls、xlsx、csv 格式)。
图2 | 样本分组信息文件格式示例图
03
特征表
(1) Biomarker : Biomarker 名称
(2) Logarithm value: 组间最大平均丰度的log10值,如果平均丰度小于10则按10来计算
(3) Groups : 组名
(4) LDA_value : LDA值
(5) p-value :Kruskal-Wallis 秩和检验p值,若不是Biomarker则用“-”表示
每组必须有生物学重复,且不少于3个样本(支持txt、xls、xlsx、csv格式,但可能会存在输入文件编码格式的问题)。
图3 | 特征表格式示例图
参数调整
01
主要参数
图4 | 主要参数
02
常用参数
图5 | 常用参数
作图步骤
01
上传文件
①请于主要参数中的层次丰度文件、样本与分组对应文件处上传您所要进行分析的文件,如果此文件未上传,您将无法得出结果。上传成功后,将会于“选择文件”后显示您上传的文件名;
此处为上传成功示例:
图6 | 层次丰度文件与样本与分组对应文件上传成功示例
②如果您需上传特征表重新绘图,则可在步骤①后,调整特征表格式于常用参数中的是否需要上传特征表重新画图处上传。上传成功后,将会于“选择文件”后显示您上传的文件名。请您注意:如果上传LEfSe_table.res.xls表,则会直接根据该特征表绘图,如果未上传此表,则会根据您上传的层次丰度文件与样本与分组对应文件重新计算。
此处为上传成功示例:
图7 | 特征表上传成功示例
02
调整其他参数
常用参数中的其他参数均为默认数值,您可根据自己的需求进行修改,点击“重置”则包括文件在内的所有参数全部清空。
①Kruskal-Wallis检验过滤阈值:α=0.05是指检验水准,若P<0.05则认为差异显著,默认预设值为0.05,只有P值小于0.05才会在图中展示;
②Wilcoxon检验过滤阈值:α=0.05是指检验水准,若P<0.05则认为差异显著,默认预设值为0.05,只有P值小于0.05才会在图中展示;
③LDA_score过滤阈值:默认预设值为2.0,只有LDA值的绝对值大于2才会在图中展示;
④柱状图标题、柱状图标题字号、柱状图Biomarker字号、柱状图图例字号、柱状图图例与画框的距离、柱状图宽度、柱状图左空间、柱状图右空间:柱状图标题可按需填写或空白,柱状图图例与画框的距离一般取值范围为0~3,主要兼容分组数太多导致图例画不全的问题。其他参数可接受默认设置或自定义输入;
⑤进化分支图标题、进化分支图标题字号、进化分支图图片高度、进化分支图图片宽度、进化分支图Biomarker图例字号、进化分支图分组图例字号、进化分支图左空间、进化分支图右空间:可接受默认设置或自定义输入;
⑥进化分支图起始层级-绘图、进化分支图终止层级-绘图:进化分支图中由内至外辐射的圆圈代表了由门至属(或种)的分类级别。默认起始层级为“门”,在最内侧,默认终止层级为“科”,在最外侧,可接受默认设置或在下拉菜单中进行其他选择。
图8 | 进化分支图起始、终止层级-绘图均选择默认结果示例
图9 | 进化分支图起始层级-绘图改为“目”结果示例
⑦进化分支图起始层级-图例、进化分支图终止层级-图例:进化分支图的图例默认起始层级为“纲”,默认终止层级为“科”,可接受默认设置或在下拉菜单中进行其他选择。
⑧输出文件类型:默认为pdf类型,其他类型有png,svg,可接受默认设置或在下拉菜单中进行其他选择。如果您选择png,点击“结果下载”,所得文件中图片仅有png格式;如果您选择pdf,点击“结果下载”,所得文件中图片包含pdf、png两种格式;如果您选择svg,点击“结果下载”,所得文件中图片包含svg、png两种格式。不论您选择何种输出文件类型,都会有png格式的图片直接显示在右侧工作区;
⑨DPI:图片的分辨率,默认为300,可接受默认设置或自定义输入;
⑩过滤Ambiguous_taxa:是否过滤输入文件中包含Ambiguous_taxa的记录,默认为“否,可接受默认设置或在下拉菜单中选择“是”。
03
最终提交
所有参数设置成功后点击“提交”,在主要参数界面或常用参数界面点击等效,您只需在任意界面点击一次即可,右侧工作区将提示您所需时间。
如图所示区域:
图10 | 工具预估耗时提示处
结果分析
(图片展示情况为使用示例文件以及其他参数选择默认)
01
结果展示及下载
分析结果图将会在此处展示,您可以点击左上角的“结果下载”将结果保存至本地。
图11 | 结果展示处
结果下载成功示例:点击“结果下载”您将会得到如下压缩包,您所得压缩包名称与下面示例名称不同为正常现象。
图12 | 结果下载成功示例
解压缩后得到以下文件:如果您如果需要上传特征表重新画图,请在此处下载LEfSe_table.res.xls文件,其他步骤请参考上述5、作图步骤→5.1、上传文件→②。
图13 | 结果文件夹内容示例
02
结果说明
①LDA值分布柱状图:
展示了LDA score大于设定值有差异的物种,即具有统计学差异的biomaker。实际显示的是不同组中丰度有显著差异的物种,柱状图的长度代表显著差异物种的影响大小。请您注意:柱状图图例分组个数有可能少于实际样本分组个数,这是由于柱状图中实际显示的是Biomarker高丰度的组,低丰度的组不显示,属于正常现象。
图14 | LDA值分布柱状图结果示例
②进化分支图:
由内至外辐射的圆圈代表了由门至属(或种)的分类级别。在不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈直径大小与相对丰度大小呈正比。图中英文字母表示的物种名称在右侧图例中进行展示。
着色原则:无显著差异的物种统一着色为黄色,差异物种Biomarker跟随组进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,绿色节点表示在绿色组别中起到重要作用的微生物类群,其它圈颜色意义类同。
图15 | 进化分支图结果示例
历史记录
点击云平台界面右上角的“登录”,您可以进行免费注册,用您注册的账号登录欧易云平台个人中心,在此之后使用云平台所有的小工具将会存有记录。您可以点击下图中的“历史记录”查看使用LEfSe分析小工具的使用记录,或点击右上角“个人中心”查看所有小工具任务记录。
图16 | 历史记录示例
常见FAQ
请问我已经有特征表,还需要上传层次丰度文件与样本与分组对应文件吗?您好,首先感谢您的咨询。如果您已有特征表,仍需上传层次丰度文件与样本与分组对应文件,这是小工具默认步骤。但是如果您上传特征表,则会直接根据特征表直接画图,如果不上传此表,则根据层次丰度文件与样本与分组对应文件进行绘图。
请问用特征表进行绘图和用层次丰度文件以及样本与分组对应文件绘图,结果有差别吗?
您好,首先感谢您的咨询。这两种方法的结果没有差别。如果您上传特征表进行绘图,工具耗费时间将会有所缩短。
以上就是LEfSe分析小工具的使用方法,欧易云平台还有更多精彩等您解锁,总有一款满足您的期待……
如果你还在为不知如何绘制SCI图表而忧愁,还在为毕业论文制图效率低下美观度不满意而焦心,或者想要找到一个高效制图的集中地……
详细技术请访问欧易生物官网
⬇
百度搜索欧易生物(oebiotech)
⬇
了解更多多组学技术
Copyright 2015-2022 起点家电网版权所有 备案号:皖ICP备2022009963号-12 联系邮箱: 39 60 29 14 2@qq.com