Genome Biology发表迄今最大的人类层相关染色质图谱,并鉴定一种中间染色质亚型

导读

随着研究的深入,科学家们发现基因组空间组织结构可作为一种协调基因表达的机制,以规范和维持细胞特性。对于整个基因组而言,大约30-40%的基因组定位于核层,位于核层的基因组位点,称为层相关结构域(Lamina Associating Domains, LAD)。

LAD一般为异染色质,且LAD内的基因经常受到转录抑制。已有研究表明,LAD具有不同的特征,表明LAD可能在不同的细胞类型中具有异质性。但LAD相关研究仍寥寥无几,科学家们对LAD亚型的理解还远远不够。

近日,来自美国格莱斯顿数据科学与生物技术研究所(Gladstone Institute of Data Science and Biotechnology)的科研团队在Genome Biology发表了题为“An atlas of lamina-associated chromatin across twelve human cell types reveals an intermediate chromatin subtype”的文章。研究团队构建了一个LAMIN B1(LB1)结合图谱,该图谱横跨所有三个胚层和胚胎干细胞(ESCs)的12种人类细胞类型。研究数据显示,在所有被检测的细胞类型中都存在两种亚型的层相关染色质,其中一种亚型与之前描述的LAD相似,具有低染色质可及性和低基因密度;另一种亚型具有中度LB1富集。总的来说,该研究提供了迄今为止最大的人类层相关染色质图谱,揭示了层相关结构域是如何参与细胞类型规范和发育的,并为未来外周染色质研究提供了重要的数据资源。

文章发表在Genome Biology

主要研究内容

三个胚层、12种人类细胞的LB1 ChIP-seq图谱

首先,研究团队从人类ESCs和来自所有三个胚层(内胚层、中胚层和外胚层)的11种ESCs衍生细胞类型生成了LB1结合图谱。使用已在人类细胞中验证的ChIP抗体进行了LB1染色质免疫沉淀(ChIP)。对ChIP-seq数据进行可视化检测,发现存在大量的、离散的LB1富集结构域,与所研究细胞类型中LAD的存在一致。

为了认识基因组中可变的LB1占用情况,研究团队在每种细胞类型中实施了隐马尔可夫模型(HMM)预测,以从LB1 ChIP-seq数据集中识别LB1富集区域。研究发现,所有12种人类细胞类型中存在层相关染色质的中间状态,与先前单细胞研究中观察到的中间LAD状态一致。

随后,研究人员将HMM状态按LB1占用率降序划分为:1型LAD(T1-LAD)、2型LAD (T2-LAD)和非LAD。T1-LAD和T2-LAD平均分别覆盖31.5和35.3%的基因组。此外,与之前的研究相似,该研究观察到每种细胞类型T1-LAD的GC含量最低,其次是T2-LAD,然后是非LAD。LB1富集在非LAD:T2-LAD和T1-LAD:T2-LAD过渡中发生了急剧变化。总之,使用LB1 ChIP-seq和细胞类型特异性的三种HMM状态,研究人员在12种人类细胞类型中鉴定出了两种LAD亚型。

图1. 12种人类细胞的LB1 ChIP-seq图谱和分型,来源:Genome Biology

T1-和T2-LAD具有不同的基因组特征

H3K9me2是一种富集在层相关染色质中的组蛋白修饰,研究人员绘制了H3K9me2 ChIP-seq图谱。在不同的细胞类型中,T1-和T2-KDD分别与T1-和T2-LAD表现出高度重叠,因此,LB1占用率在T1- KDD中最高,其次是T2-KDD和非KDD。分析证实,染色质与LB1的更大关联与12种细胞类型中H3K9me2占用率的增加相一致。

同时,研究人员分析了跨细胞类型的层相关染色质的其他特征。与T2-和非LAD相比,T1-LAD的转录组数据的基因表达比例最低;与T2-LAD相比,T1-LAD表现出更大的基因损耗。因此,T2-LAD在基因表达、基因密度和跨多种细胞类型的可及性方面介于T1-LAD和非LAD之间。

图2. T1-和T2-LAD基因组特征的分析,来源:Genome Biology

大多数T1-和T2-LAD因细胞类型而异

已有研究表明,许多LAD在不同类型的细胞之间共享,但这些研究通常局限于沿着单一分化轨迹的两种或三种细胞类型之间的比较,或在大多数是终分化/永生化的细胞之间进行比较。该研究绘制的图谱代表了许多发育不同的细胞类型,因此研究团队计算了T1-和T2-LAD在12种细胞类型的不同组合上的百分比。

当按LAD亚型分层时,T1-LAD在整体上表现出比T2-LAD更大的不变性;在比较细胞类型时,T1-和T2- LAD的不变性相似。随着细胞类型数量的增加,这种不变性越来越多地受到T1-LAD的驱动。因此,虽然T2-LAD是基于单个细胞类型中的LB1信号定义的,但它们似乎比T1-LAD更有可能在不同细胞类型之间变化。

图3. T1-和T2-LAD的异质性分析,来源:Genome Biology

整合不同细胞类型的LAD状态和基因表达

研究发现,细胞类型之间的基因表达变化通常与LAD状态的预期变化相对应。作为各种细胞类型典型标记的基因通常定位于非LAD,并在给定的细胞类型中高表达,虽然一些基因位于T2-LAD中,但仍然高表达。结合观察到这些位点在T1-LAD中并不常见,因此,与T1-LAD相比,T2-LAD可能是基因激活和表达的重要转变。

此外,研究人员还分析了中胚层谱系不同细胞类型中LAD的基因及其关联,观察到很少有基因从非LAD转移到T1-LAD(反之亦然);相反,基因关联变化主要发生在T1-和T2-LAD之间或T2-和非LAD之间,为T2-LAD作为LAD中间亚型的模型提供了额外的支持。

图4. LAD状态和基因表达的关联分析,来源:Genome Biology

结 语

综上所述,该研究展示了12种人类细胞类型的全基因组LB1和H3K9me2结合数据,这些细胞来自共同的祖细胞,代表多种发育轨迹。数据集的广度允许在细胞类型内进行LAD定义,并在多种细胞类型之间进行比较,从而为层相关染色质的复杂性质提供了额外的见解。

图5. T1-LAD和T2-LAD发挥作用的模式图,来源:Genome Biology

该研究揭示了外周染色质组织的关键细节,特别是揭示了外周染色质在多种人类细胞类型内部和之间的一致分离,以及一组重叠但不同的层相关染色质结构域的细胞类型特异性。这一研究有望扩大人们对基因组空间组织在建立和维持细胞多样性方面所起作用的理解,对未来健康和疾病研究具有广泛的潜在影响。

打开APP阅读更多精彩内容