对比健康和患病个体之间的转录水平的差异,可以识别差异表达基因(DEG),这些基因可能是疾病相关因素。差异表达基因可用于研究疾病机理或作为早期诊断的临床生物标记物,但DEG分析无法区分原因、后果或基因表达和表型之间的相关性。
目前,已有的全基因组关联研究(GWAS)确定了数千种与疾病相关的常见遗传变异。表达数量性状基因座(eQTLss)的研究显示了遗传变异如何参与基因表达水平的调控。结合上述两类研究结果显示,性状相关SNPs成为eQTLs的可能性高出三倍,因此,人们提出了许多结合GWAS和eQTLss的统计方法来检测这些重叠关联,成功识别了数千个与复杂性状相关的基因。单这些转录组范围的方法仅使用cis-eQTLs来梳理基因表达对复杂性状的因果影响。
近日,为阐明疾病对转录组程序的影响,瑞士洛桑大学研究团绝对在Nature Communications发表了题为“Differentially expressed genes reflect diseaseinduced rather than disease-causing changes in the transcriptome”的研究文章。研究团队提出了一种逆转录组范围的孟德尔随机化方法(revTWMR),可将GWAS和trans-eQTLs的研究数据整合估计表型对基因表达的因果影响,并将revTWMR结果与转录组范围孟德尔随机(TWMR)估计的基因表达对表型的因果效应相结合。利用revTWMR,研究团队获得 基因表达与复杂性状之间双向因果效应 的清晰图像 , 并评估了 其 对观察相关性的 影响 。
文章发表于Nature Communications
研究人员利用revTWMR评估了12个复杂性状之间的因果关系,包括体重指数(BMI)、克罗恩病(CD)、类风湿性关节炎(RA)、精神分裂症(SCZ)、等。研究人员将eQTLs提供的全血trans-eQTLss数据与目标性状的GWAS相结合,共同鉴定了46个基因,这些基因至少受到一种表型的显著影响。
分析发现,最有影响力的性状是甘油三酯(TG)和类风湿性关节炎(RA),分别显著影响26和15个基因的表达。对于血脂水平,revTWMR揭示,除了26个受TG影响的基因外,8个基因的表达也受HDL胆固醇水平的影响,与通常观察到的HDL和TG之间的负相关一致。
revTWMR假设所有作为工具变量的遗传变异仅通过表型而不是通过独立的生物学途径影响基因表达。为了检测多效性的存在,研究人员采用了与MR-PRESSO全局试验相似的方法,进行了Cochran的Q检验。结果显示,52个显著特征中有16个基因关联。在这16个关联中,有9个在从工具变量中去除多效性SNPs后通过了异质性测试。这一过程中,研究人员还识别出6个最初被异质性掩盖的关联,使稳健关联的最终数量达到51个。重要的是,revTWMR和其他MR方法一样,可区分因果效应和多效性。
图1. TWMR 和revTWM。来源:Nature Communications
研究人员收集了三个独立的欧洲队列(EGCUT(N=488)、InChianti(N=609)和SHIP Trend(N=991))中全血基因表达水平和数量性状之间的观察相关性估计。将revTWMR效应与观测相关性相关联,发现所有性状都有显著一致性,观察相关性与TWMR估计的基因表达对表型的因果效应之间未观察到显著相关性。值得注意的是,当研究人员将观察相关性与基于GWAS的传统基因检测结果相关联时,仅检测到HDL和TG的显著一致性(表1)。
表1. 观察表型基因表达相关性与revTWMR和TWMR效应之间的相关性。来源:Nature Communications
正如研究人员此前预测的的,观测相关性可以近似为TWMR和revTWMR估计的双向效应加上混杂因素的贡献之和。因此,研究人员计算了由混杂因素引起的相关性比例。对于每个基因,研究人员计算了TWMR和revTWMR的贡献,并揭示了观察到的基因表达和表型之间的相关性主要由混杂因素驱动。例如,对于与BMI相关的基因,83%的相关性来自混杂因素,17%来自BMI对基因表达的影响,0%来自正向效应。(图2)
图2. BMI、HDL和甘油三酯的基因表达特征观察相关性。来源:Nature Communications
已鉴定的基因可能代表疾病的早期生物标志物,对其表达的调控可能是一种有前途的治疗策略。因此,研究人员评估了revTWMR分析确定的蛋白产物能否作为治疗该疾病药物的靶点。结果发现,revTWMR检测到的8个高密度脂蛋白胆固醇基因中,有4个基因的基因产物符合这些标准,说明受脂质特性影响的基因与药物靶点有关。
revTWMR还指出了26个受TG水平影响的基因,研究人员分析了这些基因的肝脏表达和TG水平如何在小鼠BXD遗传参考小组中受到共同影响。分析发现,在revTWMR测试的19942个基因中,在小鼠样本中检测到10841个具有可检测的同源基因。在显示显著相关性的基因中,发现revTWMR基因丰富,对重要的TWMR基因进行相同的分析并没有产生富集,表明相关性主要由TG对基因表达的影响驱动。
综上所述,该研究提出了一种孟德尔随机方法来研究人类表型对转录组的影响。研究人员的双向分析理清了复杂性状基因表达的原因和后果,并揭示了复杂性状对基因表达的影响更为显著。revTWMR结果不仅解释为疾病发病后下游机制的标志物,还可作为潜在的早期生物标志物。
参考文献:
Porcu, Eleonora et al. “Differentially expressed genes reflect disease-induced rather than disease-causing changes in the transcriptome.” Nature communications vol. 12,1 5647. 24