想了解遗传进化分析内容!
想定制化绘制优美漂亮的图形!
想了解遗传进化在文章中的应用!
看看这篇文章,来点小灵感!!!
01
系统发育树
系统发育树(phylogenetic tree),又称系统发生树、演化树、进化树、系统树、系统演化树、种系发生树等。表明被认为具有共同祖先的各物种之间的演化关系树形图,用来描述物种之间的分类和演化关系。
自达尔文时期,很多生物学家希望用一棵树的形式,描述地球上各个物种的演化史。最理想的方法,就是采集各个物种的化石(直接证据),基于化石信息构建系统树。但是最大的缺点就是化石零散、不完整,甚至没有。
既然化石先天的缺陷不能大规模用来重建物种系统发育树,生物学家就考虑根据物种的外观形态,采用比较形态学、比较生理学的方法进行系统发育树的重构。这种方式只能确定大概的系统进化框架,细节存在很大的争议。
怎么解释趋同进化、趋异进化和平行进化?
趋同进化:亲缘关系较远的物种,由于生存环境相似,从而演化成具有相同构造或者形体结构的现象。
趋异进化:亲缘关系很近的物种,由于生存环境不同,各个物种为了适应各自的生态位而进行了分化,从而导致形态学上存在很大差异。
平行进化:拥有共同祖先的后代生物之间各自适应于相似的生活环境而独立发展成形态上相似的进化现象。
趋同进化和平行进化的主要区别在于亲缘关系的远近。
1964年,Linus Pauling提出分子进化理论。
基本原则:核苷酸和氨基酸序列中含有生物进化历史的全部遗传信息。基于分子特性(DNA、RNA、氨基酸、蛋白质)推断物种之间的系统发生关系。也就是基于传统的SSR标记、高通量测序的SNP标记,采用数据模型描述物种之间的进化规律,构建系统发育树。
系统发育树图示
02
群体结构
群体遗传结构(structure)指遗传变异在物种或群体中的一种非随机分布。按照地理分布或其他标准可将一个群体分为若干亚群,处于同一亚群内的不同个体亲缘关系较高,而亚群与亚群之间则亲缘关系较远。
群体结构分析有助于理解进化过程,并且可以通过基因型和表型的关联研究确定个体所属的亚群。
群体结构,又称群体分层,指所研究的群体中存在基因频率不同的亚群。
群体结构图展示
群体结构和系统发育树组合图展示
03
主要成分分析
主成分(Principal Component Analysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分分析主要应用:群体分层、outlier筛选、亚群进化关系、群体结构矫正。
基本思想:设法将原来众多的具有一定相关性的变量(标记)重新组合成一组较少个数的互不相关的综合变量(主成分)。
横轴和纵轴两个随机变量,如何找到它们“与”的线性组合,使其包含的信息量最大?
上图中实线方向所对应的线性组合,其波动幅度最大,故信息量最大。在数学上,这意味着,该线性组合的方差最大。
推而广之,对于多维随机向量,希望可以找到多个线性组合,即多个主成分。其中,第一个主成分包含的信息最多,第二个主成分包含的信息第二多,以此类推。这些主成分之间相关性几乎为0,即主成分之间信息没有重合。
PCA二维图展示
04
选择清除分析
在中性进化理论下,一个新的突变往往需要很长一段时间才能够在群体中达到一个较高的频率,并且这些突变周围的连锁不平衡程度会因重组率的影响而在这段时间内几乎完全衰减降解。因此,基因组上绝大多数未受到选择作用的位点会始终处于随机漂变状态,彼此之间形成的连锁不平衡容易衰减,单倍型长度相对较短。然而在选择的作用下,群体有利等位基因频率则会在较短的时间内达到一个较高的值,重组的作用会受到一定程度的对冲而不能对长范围单倍型造成实质性的降解。同时,选择作用下的连锁不平衡会造成选择位点附近的中性位点的基因频率随之增加形成长范围的单倍型纯合。群体遗传学中,将这种由选择作用造成的部分染色体片段的多态性降低现象称为选择性清除。
自然选择促使有利突变在群体中保留下来,与之连锁的中性位点突变频率提升,非连锁的中性位点突变频率下降;简单的说就是基因组某区域由于受到了选择而消除多态性,即遗传多样性降低,在群体中出现高频的等位基因和低频的等位基因。
正选择 vs 负选择?
正选择(positive selection):自然选择“选留”一些稀少的等位基因,拥有这些等位基因的个体能繁殖更多的后代;这样的突变基因往往具有与原来基因不同的功能,而且该功能使得拥有它的生物更能适应环境。
负选择(negative selection):指群体中出现有害突变等位基因时,携带该等位基因的个体会因为生存力或育性降低而从群体中淘汰,也叫净化选择。
选择清除vs背景选择?
选择清除:在有利突变产生后被正选择固定的过程中,与之连锁的中性位点的变异也被固定。
背景选择:负选择在清除有害突变时,也会随之清除与其连锁的中性位点的变异。
选择清除和背景选择都会导致基因组上受选择的区域遗传多样性下降,两者很难区分,但背景选择在群体中不会导致高频等位基因突变出现。