新京报讯(记者 李玉坤)近日,以我国科学家为主导,中外科学家共同合作,以狨猴为模式,首次用新方式对该非人灵长类动物全基因组数据进行分析和组装,为高质量基因组分析提供了新模式。这项成果已发表于著名学术期刊《自然》杂志,并于北京时间4月28日23时在《自然》官网上线。
普通狨猴。华大基因供图
此前基因测序方式存缺陷
“正常人的体细胞内有46条23对染色体,但传统方法在测序后只能组装出22条常染色体再加上XY染色体,也就是24条。”论文第一作者、深圳华大生命科学研究院和哥本哈根大学联合培养的博士生杨琛涛介绍,染色体DNA是很长的生物大分子,由四种碱基按照特定的顺序排列,这些独特的排列顺序代表了生物的遗传信息。
按照目前的方式,DNA测序时,无法对整条DNA分子进行测序,而是采用分而治之的方法先获得大小不同的数据片段,然后通过算法将这些数据组装成完整的染色体DNA信息。
“个体的染色体是成对存在的,一条来自父亲,一条来自母亲,两条对应的常染色体演化起源相同、序列相似,但又存在遗传差异。组装时,在某些有差异的区域算法无法区分它们,这时候只能随机保留其中一条的数据。比如两条1号染色体的数据,最终会拼接成1条父母本‘嵌合’的1号染色体。这类似于由两种颜色拼成的马赛克图案,会导致我们在检测变异位点的时候,丢失掉变异位点之间的连锁关系,即不知道这些突变是以何种组合方式遗传到子代。”杨琛涛说。
新方法可以获得父本母本两条染色体
“我们在狨猴基因组测序中首次尝试了新的方法。”论文共同第一作者、深圳华大生命科学研究院副研究员周旸表示。
周旸对这一方法进行了进一步的解释。简单来说,这种方法不仅对子代进行基因组的三代测序,同时还对其父母本的基因组进行二代高深度测序。通过父母本的高深度测序数据,科学家得到父母本各自特有的序列集合,并利用这个信息将子代的三代测序数据拆分成独立的父母本两套数据,分别进行组装。经过一系列的拼接搭建过程,最终得到了两套各自组装到染色体级别的父母本单倍体基因组。实验中,母本和父本的单倍体基因组的单碱基精确度分别达到了99.996%和99.998%。
这种通过家系进行组装测序的方法将为人们提供独立拆分好的两套基因组序列。这一方面有助于人们研究父母本两套染色体中序列间的差异以及这些突变之间的连锁关系,另一方面也将辅助人们进行更精细的基因表达调控等方面的研究。
“利用被测个体的父母本的测序数据进行遗传信息区分,我们的算法可以完美地将两条同源染色体分别组装出来。这样,我们就能获得全部染色体的遗传数据,这是一个很大的进步。相关的方法,未来可以应用到更多物种的分析中。”周旸说。
两种不同组装策略的比较。杨琛涛、周旸 绘
人和狨猴Y染色体间存在至少3个较大结构变异
“得益于新的高质量染色体数据,我们终于有机会能够对来自父亲和来自母亲的两套染色体进行直接地比较。”杨琛涛表示,“如果考虑到所有类型的遗传变异,单个个体的基因组杂合率要远远高于过去传统方法所预测的结果。另外,有意思的是,来自父亲的种系突变是来自母亲的两倍。这可能与卵细胞和精子的形成过程中细胞发生复制分裂的次数不同有关。”
通过物种间的比较分析,研究确认了X染色体在灵长类物种间基本保守,而Y 染色体在物种间则经历了较大的变化,这很可能是由于Y染色体无法进行重组而导致突变积累所致。
“我们也对狨猴生物学进行了分析。”周旸补充,“我们发现狨猴的Y染色体上比人多出了一段雄性特异性序列,而且在一些参与人类精子形成的基因在狨猴中丢失或者失去功能。”
例如,与人比较,人和狨猴的Y染色体间存在至少3个较大的结构变异。另外,相对于人来说,狨猴的Y染色体上一些对精子形成过程至关重要的基因发生了丢失或假基因化。这一现象可能与狨猴一夫一妻制的婚配方式导致雄性个体精子竞争的降低有关。
而相比之下,狨猴的Y染色体上只携带两个人类不存在的基因。其中一个基因是特异地从狨猴X染色体上的同源基因复制而来;这个基因在其他灵长类的Y染色体上都不存在。“考虑到这个基因在狨猴中是一个睾丸特异表达的基因,我们推测这个基因可能对雄性狨猴的生殖发育有着重要的作用。”周旸说。
研究或推动精准医疗
“2021年是人类参考基因组草图序列公布20周年,但如何构建参考基因组序列仍是当前基因组研究的重点攻关领域。”该研究的通讯作者,深圳华大生命科学研究院、中国科学院昆明动物研究所及丹麦哥本哈根大学的张国捷教授表示。
他介绍,基因组中包含大量与健康、疾病和表型相关序列,对这些序列的研究有赖于基因组序列的准确度。近几年,基因组序列功能的研究对获得更高质量基因组提出了新要求,完美参考基因组序列的定义也一直随着测序技术发展而更新。
“我们对二倍体物种完美基因组序列提出了新的标准,即二倍体细胞中的两套基因组应分别独立组装到染色体水平并含有极少的测序漏洞。本次研究我们论证了实现这一目标的可行性。”张国捷教授总结说,“另外,高质量的狨猴基因组也利用这个物种作为动物模型的医学研究提供重要遗传数据。”
通过对狨猴这个生物医学模式物种的基因组测序和组装,新的测序组装技术展示出了极大的潜力,可以为科学家提供一个非常精准的基因组数据支持,在此基础上可以进行更为精细的疾病相关研究。
人类基因组学在未来20年将走向何方?主要期望指的是精准医学的实施,该医学利用遗传信息根据每个人独特的遗传特征来定制干预措施,以预防和治愈从精神疾病到癌症的疾病。“所以我们预测这种新技术会有很大的用武之地。”
■延展
为何选狨猴?与人有许多共同特征
普通狨猴(Callithrix jacchus)是生活在巴西东北部大西洋沿海地区热带地区的一种小型猴子。成年的狨猴只有手掌大小,是世界上体型最小的灵长类之一,是医学研究常用的模式动物。
狨猴与人都属于简鼻亚目(Haplorhini),但人类以及其他猿类是起源于亚洲和非洲的旧世界猴(Catarrhini),而狨猴则是起源于拉丁美洲的新世界猴(Platyrrhini)。新旧世界猴在形态上有很多显著的差别,例如身体大小,鼻孔的形态,牙齿数目等,而身体大小在狨猴亚科体现的尤为显著,这也成为了它们在实验室饲养的一个重要优势。另外,不同于旧世界猴的繁殖特点,狨猴的寿命比较短,性成熟时间也较短,生育双胞胎的概率非常高,因此可以为实验室提供非常充足的样本资源。
“狨猴与人类在解剖学、生理学和药物代谢方面具有许多共同特征,因此能开发出多种医学研究模型。这些模型可以应用到神经退行性疾病、生殖生物学、药物动力学及药物的毒性筛查、干细胞研究、自身免疫性疾病、感染性疾病等多方向的研究中。”杨琛涛解释说,“因此,对狨猴高质量遗传信息的解读,对于推进人类疾病研究非常重要。”
新京报记者 李玉坤
编辑 白爽 校对 王心