导读
近日,全球首个CRISPR基因编辑疗法上市申请获受理,这意味着全球首个CRISPR-Cas9治疗药物即将诞生。与此同时,这种疗法所带来的脱靶效应隐患仍无法忽视,对脱靶位点的全基因组识别对基因组编辑药物来说特别重要。
为此,很多研究团队开发了一系列方法来预测可能的全基因组脱靶效应,例如GUIDE-seq、Digenome-seq和硅片法等。但目前可用的预测工具均存在不同程度的局限性,例如,基于细胞的方法偶尔会错过真正的脱靶位点,并可能在临床更相关的细胞类型中显示出错误解读;体外方法提供了较多的假阳性数据,不能反映细胞内环境的特征。因此,仍需开发一种更有效、更准确的全基因组脱靶预测工具,以在最大程度上克服现有方法的局限性。
近期,韩国研究团队在Genome Biology杂志发表了题为“Extru-seq: a method for predicting genomewide Cas9 off-target sites with advantages of both cell-based and in vitro approaches”的文章。研究团队开发了一种新的基于细胞的体外全基因组Cas9脱靶预测方法Extru-seq,该方法结合了基于细胞和体外方法的优势。通过比较,Extru-seq的验证率和ROC曲线下面积与GUIDE-seq相当,远高于Digenome-seq和硅片法。结果表明,Extru-seq具有基于细胞的方法特征,且很少错过脱靶点,漏检率仅为2.3%,比GUIDE-seq低12.6倍。此外,Extru-seq易于执行,几乎不需要优化即可在原代细胞中使用。总之,Extru-seq是一种兼具多种优良性能并且方便易行的方法。
文章发表在Genome Biology
主要研究内容
目前,全基因组脱靶预测方法根据其一般原理分为三大类:细胞、体外和硅芯片。研究人员从每个类别中选择了一种方法来比较它们的性能:对于基于细胞和硅芯片的方法,选择了GUIDE-seq和CAS-OFFinder,两者是基于Cas9治疗的最常用方法。对于体外方法,选择了Digenome-seq,其多在EDIT101研究中使用,并且是与大量先前研究进行比较的最受欢迎的方法之一。
据文章介绍,Extru-seq是通过机械破坏细胞,并将基因组DNA、Cas9和sgRNA混合。活的HEK293T或NIH-3T3细胞与预先培养的Cas9-sgRNA RNP复合物混合,借助滤纸破坏细胞膜,使得Cas9 RNPs可访问基因组DNA。经孵育后,进行全基因组测序(WGS)文库构建。
图1. 基因组脱靶预测方法汇总及Extru-seq原理,来源:Genome Biology
使用不同方法预测全基因组脱靶位点
研究人员使用针对PCSK9和白蛋白的杂乱sgRNA序列,利用GUIDE-seq、Digenome-seq、Extru-seq和CAS-OFFinder对人(HEK293T)和小鼠(NIH-3T3)细胞系进行了预测。来自GUIDE-seq的序列读取计数和来自Digenome-seq和Extru-seq的DNA切割得分可以对每个候选脱靶位点进行排名。对于CAS-OFFinder,研究人员使用来自机器学习研究的两种不同脚本计算了每个候选脱靶位点的预测分数用于排名。
研究人员预计,随着错配次数的增加,相应的预测分数会降低。GUIDE-seq和硅芯片方法预测遵循了这一趋势,但Digenome-seq在有4个、5个或6个错配的情况下,呈现了具有高DNA切割分数的异常值。当使用Extru-seq方法计算候选脱靶位点的DNA切割得分时,没有观察到超过4个错配的sgRNA的高DNA切割得分。该结果表明,Extru-seq识别的假阳性比Digenome-seq少,后续的验证实验也证明了这一点。
图2. 不同方法性能评估及比较,来源:Genome Biology
Extru-seq漏检率低于GUIDE-seq
基于细胞的方法,包括GUIDE-seq,已知偶尔会错过真正的脱靶候选位点。研究人员使用维恩图计算了漏报率 (假阴性率)。结果表明,Extru-seq和GUIDE-seq预测与深度测序分析样本中验证靶标之间存在重叠。GUIDE-seq的平均漏检率(29%)是Extru-seq漏检率(2.3%)的12.6倍。上述结果表明,Extru-seq方法的灵敏度明显高于GUIDE-seq方法,很少遗漏真正的脱靶位点。经检测发现,GUIDE-seq忽略了包含1到6个错配的有效脱靶点。因此,仅依赖于GUIDE-seq的新药研发可能会忽略有效的脱靶候选药物。
图3. 不同方法预测脱靶位点数量,来源:Genome Biology
Extru-seq的ROC曲线下面积最大
研究人员使用序列reads计数、DNA切割评分、CFD评分 (CFD) 作为指标,以二元分类方式验证了不同方法的预测结果。计算ROC曲线下面积(AUC)显示,Extru-seq的AUC为0.83,GUIDE-seq为0.81、Digenome-seq为0.72,表明Extru-seq的预测效果较好。Extru-seq的AUC值最大表明,Extru-seq的DNA切割评分作为验证结果的二元分类器具有较高的性能。此外,使用不同的阈值可能会影响每种方法预测的脱靶位点数量。
图4. 不同方法ROC曲线,来源:Genome Biology
结 语
综上所述,研究团队开发了一种基于细胞的体外全基因组脱靶预测新方法Extru-seq,并将其与三种不同的全基因组脱靶预测方法进行了性能比较。Extru-seq的验证率和AUC(92.5%和0.83)与GUIDE-seq的验证率和AUC(97.5%和0.81)相当,这些值都高于Digenome-seq和基于硅芯片的验证率和AUC。Extru-seq显示出较高的验证率和细胞内环境信息的保留,这是基于细胞的方法的两个有益特性。同时,Extru-seq的漏检率也很低,可以很容易地在临床相关的细胞类型中进行,无需进行优化,这是体外方法的主要优势特征。Extru-seq显示了细胞基础和体外方法的共同有益特性。