01
爱基百客云平台小工具使用
首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。
弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!
登陆后,如下图,我们进入到小工具专栏。当前云平台已上线了32款小工具供大家使用,包括基础绘图,高级绘图,差异检验,聚类分析,序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。
1.1
爱基百客云平台之富集分析
上期我们讲到了时序分析。那本期我们就来聊一聊富集分析。
基因富集分析是一种对基因进行富集分析的方法,检验目标基因集(即gene set)。KEGG/GO富集分析在方法学上均属于过表达分析(Over Representation Analysis,ORA),是最常使用的富集分析方法之一。ORA以fisher精确检验(一种超几何分布检验)为代表,需要目标基因集(对什么基因集进行富集分析),通常是差异基因,当然也可以是其他目标基因集,比如上期我们分享的时序分析聚类基因、多个组学联合筛选的候选基因集、WGCNA分析中关注的模块基因等等。基于富集结果,通常我们都能找到感兴趣的通路并进行进行绘图。
爱基百客云平台提供了富集分析小工具:http://124.71.149.47:5000/smalltools/detail?id=1635906319233855489。如果您在我司做过项目,直接输入基因集和基因组名称即可一键式完成富集分析。
下面我们进行富集分析实操练习。
首先点击小工具GO/KEGG富集分析
右侧的工具介绍和常见问题对富集分析小工具的主要用途,使用方法以及结果解读做了详细的说明。左侧是必要的输入文件和参数选项。任务名称和任务编号系统会自动生成。后面可用于记录查看具体的任务。小工具提供了示例文件给用户做测试分析。同时,该页面还提供了一些常用参数调节选项。您也可进行自定义,后面将详细介绍。输出名自定义,默认Enrich。
1.2
参数设置
输入文件:支持txt(制表符分隔)文本文件,以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。
基因列表是仅为一列基因名的表格文件。如下表所示:
如果文件已经上传过,您可以直接点击选择按钮找到需要的文件勾选确定,无须再次上传。
物种选择项目中所使用的基因组名称;富集类型支持GO和KEGG;筛选条件支持三种检验方式:pvalue/p.adjust/qvalue,默认是qvalue。显著性阈值您可根据实际情况进行筛选,默认是0.05。输出名自定义即可。
填写好上述所有的参数后,点击提交即可。
1.3
任务查看
您可在任务管理栏中查看任务的运行情况和结果。默认情况下新任务将会在最上方展示。也可通过任务名、任务编码、日期点击查询,找到需要的任务。如下图:当状态成功时,表示任务成功结束。
点击下载按钮可直接打包下载全部结果。点击查看按钮可在线查看结果。
您可在在线查看结果后选择是否下载保存。另外如果结果较多时,结果展示区还可通过点击左侧或右侧的箭头进行图片切换。您可挑选自己感兴趣的结果图片进行下载保存。
1.4
结果
输出结果包含富集柱状图、气泡图、网络图和upset图pdf/png,支持矢量图和位图图片格式下载。
1.4.1
富集柱状图
富集柱状图展示的是差异基因在不同条目(通路)中的数目分布情况,通常以x轴表示该条目的数量,y轴表示富集条目,柱子的颜色表示显著性,用红蓝渐变色表示,颜色越红代表该条目越显著。最终展示Top5显著的条目。
1.4.2
富集气泡图
富集气泡图可以从多个维度来展示富集分析的结果。横坐标为Rich Factor或Gene Ratio。Rich Factor用于评估物种或样本的基因表达(丰富度)多样性。Gene Ratio代表富集基因集中某条目包含的差异基因数占其背景数据库中基因数的比例;气泡的的颜色表示显著性,用红蓝渐变色表示,颜色越红代表该条目越显著;气泡大小表示某条目中富集的的差异基因数目。
1.4.3
富集网络图
富集网络图可以帮助识别和可视化基因和通路在生物学功能上的相关性。通过绘制基因富集的网络,可以直观地显示哪些生物学过程被显著改变或关联,有助于理解特定生物学现象或疾病的生物学基础。
1.4.4
富集Upset图
Upset图(UpSet Plot)是一种数据可视化工具,常用于研究多个条件下的样本集合或事件的重叠和并集分析。在基因富集分析的背景下,Upset图可以用来显示多个富集结果集(如多个生物学过程、通路或基因集)之间的不同组合,帮助用户理解不同条件或实验组之间的重叠和差异。
1.4.5
富集结果表格
富集结果表格包含富集条目、Count数、基因名、前景基因比率和背景基因比率、显著性等信息,具体如下表:
结果中提供了过滤后和过滤前的两个表格。您可结合自己的研究背景和富集结果筛选选用合适的阈值。
1.4.6
富集结果可视化
在实际项目研究中,我们有时需要定制化展示某些通路。此时,基于公司提供的富集结果,您可直接在表格中筛选出关注的通路。输入筛选后的富集表格进行可视化。富集结果可视化小工具用于已有了富集结果表格,想定制化展示某些关注的通路。
下面我们进行富集结果可视化实操练习。
同样是找到富集结果可视化小工具:http://124.71.149.47:5000/smalltools/detail?id=1780838123081572353
具体背景这里不再赘述。在左侧参数面板中,富集结果表格是输入筛选后的富集条目,通常5~10个。显著性方法同富集分析。气泡图横坐标可选Rich Factor或Gene Ratio。气泡图和柱状图可按照从大到小或者从小到大进行排序。
最后可以得到一系列富集可视化结果。
相信看了今天的教程,大家对云平台的认识又加深了一层。那就赶快拿自己的数据试一试吧。