假如实验设计(比较组)是 Case组 vs Control 组 、敲除/过表达组 vs 对照组等,如何看2个比较组在组学(mRNA)层面上是否有组间差异呢?样本间相关性系数分析和PCA可以提供答案。
(1)相关性系数越接近1,表明样本之间表达模式的相似度越高;对于同一组的生物学重复样本来说(如A1/A2/A3/A4/A5…),相关性系数越接近说明同组内的生物学重复越好;不同组别(A组和B组)之间的相关性系数相差越大越好,说明不同组别之间的差别越大,组间的差异基因可能越多;
(2)同样,同一组的样本越接近说明组内生物学重复越好;不同组别的样本在PCA中距离越远越好,说明组间差异越大。当然除了样本间相关性系数分析和PCA分析外,还有其他分析方法,在此先不赘述了呢~
差异基因的GO/KEGG富集散点图是富集分析结果的一种可视化展示方式。默认挑选富集显著的 Top20 GO term/pathway进行展示,此图中通过Rich factor、P value 和Gene number (富集到此通路上的基因个数)来衡量其富集程度。当然,如果有特别关注/感兴趣的GO term/pathway,也可以针对目标term 进行个性化调整,以实现对特定功能类别的聚焦。