作为生物医学科研人,学会看各类数据图是必备的科研技能之一。今天,小编将从定义、用途和具体案例等方面,带大家一起来解读【GSEA富集图】~
导读
1.GSEA富集图的定义&用途
2.结合具体案例怎么看?
3.GO、KEGG、GSEA分析的区别在哪?
4.为何已经做了GO/KEGG富集分析了,还要再做GSEA?
01
GSEA富集图的定义和用途
定义
GSEA(基因集富集分析)在生物信息学领域中扮演着重要角色,主要用于评估基因集中基因在与表型相关度排序的基因表中的分布趋势,从而判断这些基因集对特定表型的贡献。
用途
关注全局视角:GSEA不是关注单一基因的差异,而是关注一组基因集合的整体行为,从而能揭示生物学过程的整体模式,而不仅仅是局部变化。 验证生物学意义:通过预定义的基因集,GSEA提供了生物学意义的验证比如特定通路的活动,帮助理解基因表达变化背后的生物学背景。 处理复杂数据:GSEA可以处理复杂的数据分布,如连续的基因表达数据而不仅仅是二元的上调或下调状态。02
结合具体案例怎么看?
①表头:富集通路名称,即RUTELLA对HGF UP的回应
②Enrichment Score (ES):一项指标(富集分数),用于量化基因集成员S在排序列表L两端的富集程度,以反映其在特定条件下的显著性和相关性
③排名指标
④图例
NES:标准化后的富集分数
FDR:假发现率(PS.一般认为|INES|>1,p-val<0.05,FDR q-val<0.25的通路是显著富集的)
⑤ES峰值
⑥ES折线图:反应基因集S成员在排序列表L的富集程度
绿色曲线:即富集曲线,表示ES打分的动态过程,该基因集的最终ES值为峰值(最高或最低点),正ES值表示富集在L的顶部,即富集通路为上调通路;负ES值表示富集在L的底部,即富集通路为下调通路
⑦领头亚集(Leading edgesubset):是指对ES值贡献最大的基因集合。当ES为正值时,领头亚集基因位于ES峰值之前;反之,则位于ES峰值之后
⑧基因位置信息:黑色线条展示的是当前分析的基因集S中每个基因出现在基因排序列表L中的位置,每一根线条代表基因集中的一个分子
⑨零点交叉
⑩热图+灰色面积图:这一部分其实主要展示的是基因排序表L的信息。横坐标代表所有基因的位置,纵坐标代表该基因与表型的关联程度。从大到小排列,所以正相关性越强,基因排序位置越靠前;负相关性越强,基因排序位置越靠后。热图同样展示了基因与表型的关联程度,红色部分对应的基因在DNPC组中高表达,蓝色部分对应的基因在ARPC组中高表达
⑪图例
Enrichment profile:富集剖面
Hits:点击数
Ranking metric scores:排名指标得分
结果解读
使用来自DNPC与ARPC的差异表达基因(DEGs)的预先排名的基因列表,其对数为|log2折叠变化|>1和校正的P值<0.05,GSEA显示出HGF/MET和Wnt/B-catenin信号通路上调的显著富集。
03
GO、KEGG和GSEA分析的区别在哪?
GO和KEGG是用于基因功能分析和关键基因筛选的常用方法,有助于识别差异基因可能影响的生物功能,并指导后续实验。但是它们依赖于设定阈值,且仅关注少数几个显著上调或下调的基因,可能忽略一些表达不显著但生物学意义重大的基因。
GSEA分析可以在不做差异分析的情况下,找到和性状相关的通路功能基因集合,也就是可以将所有的基因视作“目的基因”,从而避免了以上问题,但其分析过程也变得更加复杂,目前仅在医学方向应用比较广泛。
04
为何已经做GO/KEGG富集分析了,还要再做GSEA?
GO/KEGG富集分析是先筛选差异基因,再判断差异基因在哪些注释的通路存在富集;并且还需要提前设定一个阈值,不仅存在主观性还只能用于差异较大的基因。
GSEA不受差异基因限制,无需设定阈值筛选,可分析任意感兴趣的基因集,不限于显著差异表达基因。GSEA分析能包含GO/KEGG富集分析中遗漏但具重要生物学意义的非显著差异表达基因。
转自:科研百味
声明:本文提供的部分资料综合整理自网络,仅供学习和研究使用。如有侵权,请联系我们删除~
数据分析工具不会用?数据挖掘无从下手?
与其花半年自学,磨个1年没结果
不如交给专业团队,最快10天出成果!
基础&临床
数据分析服务
8年服务经验,20000+成功案例
数据分析0失误率,成果真实有效
服务答疑环节
Q1
服务靠谱吗,分析师是否专业?
团队——「教授级」水平
一流服务团队,来自985/211顶尖院校
深耕医学生物领域,20+数据分析工具手拿把掐
结果——100%真实有效
尊重原始数据,最大程度挖掘有效结果
单位是否认可?放心!绝对认可!
隐私——密上加密
业务开展前期签署保密协议
个人隐私绝对安全
抢发SCI
评职称的要求达到了,心里美滋滋~
即刻咨询,抢占先机
Q2
多久能拿结果,数据会泄露吗?
速度比找课题还快!
3天定方案,10天拿结果
加快文章完稿,SCI发表不耽误
数据比锁保险箱里还保险!
正规企业,诚信经营!
数据泄露0发生,100%严格保密!
同事文章都投稿了,你还在犹犹豫豫?
即刻咨询,早定早享受
END返回搜狐,查看更多