随着国内医疗设备国产化政策的迅速推进,华大智造采用DNBSEQ核心技术推出了多款不同规格的测序仪和自动化产品以满足不同用户的需求。其中,MGISEQ-2000作为全面、灵活的大中型基因组测序平台,因其性能表现和性价比的优势,被广泛应用于无创产前检测、重症感染鉴定、单基因遗传病筛查或诊断、癌症个体化治疗等临床领域。
人类外显子组占全基因组的比例不到2%,却包含了约85%的已知的与疾病相关的基因变异。全外显子组测序作为应用最为广泛的大规模平行测序技术之一,被应用于遗传病研究和筛查、肿瘤突变负荷(TMB)、微卫星不稳定(MSI)以及拷贝数变异(CNV)等分析。本期将为大家展示IDT埃德特xGen人全外显子V2 Panel在MGISEQ-2000平台上的具体测评数据。
测评方案
建库试剂:
IDT埃德特xGen人全外显子V2 Panel,以下简称V2
样本类型:
标准品NA12878
文库制备:
DNA片段化采用酶切打断,自动化建库平台MGISP-100搭配MGIEasy酶切DNA文库制备试剂盒;DNA起始量为400ng,操作流程按照官方说明书。
靶向捕获:
每个样本取500ng捕获前文库与V2探针进行单杂,4杂,8杂,12杂的实验,操作流程按照官方说明书;经过12个PCR循环后得到预文库;预文库在杂交洗脱后PCR6-8个循环即可得到终文库。
测试地点:
华大智造客户体验中心(武汉)
测序平台:
MGISEQ-2000RS平台(FCL PE100)
数据分析:
生信分析基于MegaBOLT服务器;测序数据均一化到目标区域覆盖深度100X(在12杂情况下单样本约7Gb数据量)
测评结果
1
出色的性能指标
实测数据显示,V2在MGISEQ-2000平台上无论是在单杂还是多杂情况下均表现出优异的比对率(Reads mapping rate),各文库的比对率均超过99.8%(图1A),数据冗余率(Duplication rate)浮动范围在4%-5%左右(图1B)。测评数据表明,V2在MGISEQ-2000测序平台上可以稳定获得高质量的测序数据,且测序结果具有低重复率特性,在需要高深度测序的应用场景下可以大大降低测序数据量。
在此次实测中,V2无论是在单杂还是多杂情况下,均可以达到出色的捕获效率:如图1C所示,在样本混合程度较低时,重复实验的数据表现稳定;在样本混合程度较高时,则保持了与单杂相当的捕获效率。在保证数据性能的同时,极大地降低了杂交捕获实验的成本。
1A
1B
1C
图1. V2在不同样本混合情况下的数据表现:(A)捕获数据比对率 (B)捕获数据的数据冗余率 (C)捕获效率
比对率:反映了样本的测序数据和参考基因组之间的相关性,可以衡量测序的整体准确性以及是否在实验中引入DNA污染,比对性越高则代表准确性越好。数据冗余率:反映了在建库捕获流程中因为诸如PCR扩增等实验步骤引入的重复数据所占的比例,这些重复数据没有价值且会拉高有效测序数据的成本,因此在实验中越低越好。捕获效率:数据分析中的关键参数之一,捕获效率的高低并不影响数据质量,但影响有效数据所占的比例。捕获效率越高,在相同大小区域实现相同深度覆盖所需要的数据量也就越小,测序成本越低。
2
优异的覆盖均一度
xGen Hyb探针采用全新的"目标感知"(target aware)设计算法,在经典的IDT埃德特V1版本全外显子探针基础上,V2在目标区域覆盖度方面更进一步。测评结果显示,在MGISEQ-2000平台上,V2无论是在单杂还是12杂的0.2×平均覆盖度均达到了98%以上,在12杂的情况下也能保持和单杂相当的覆盖均一度(图2A)。
3
高效的数据利用率
基于IDT埃德特多年的探针设计经验的积累,V2在1杂、4杂、8杂、12杂时靶区域深度平均可达到12.3×/Gb这一高效的数据利用率,在12个文库混样杂交时甚至可以达到13.4×/Gb的高效数据利用(此时平均测序深度约为110×)(图2B)。在高通量样本处理时,通过多杂的实验方案可以显著降低手动操作的复杂性,减少实验出错的可能;结合中靶效率、覆盖均一度和数据利用率这些参数进行综合评估,V2在保证数据性能高质和稳定的前提下降低了试剂成本。
2A
2B
图2. 在不同的样本混合程度下V2的覆盖均一度和数据利用率:(A)无论在单杂还是12杂时,V2的0.2×平均覆盖度都达到了98%以上;(B)在12杂时,V2实现了高达13.4×/Gb的高效数据利用率。
覆盖均一度:靶向测序中最重要的性能参数之一。覆盖均一度体现的是有多少目标区域可以达到所需的分析要求。在相同的目标区域,相同的测序总量下,覆盖度越均匀,高于0.2×平均测序深度的比例越高越好。换言之,覆盖均一度优秀的探针产品可以减少测序数据量,达到降低测序成本的效果。
4
一致的变异检出率
WES测序可以同时检测整个基因组编码区的遗传变异,这一特点也使其成为一种前景广阔的遗传性疾病的研究工具。单核苷酸多态性(SNP)和插入缺失(Indel)是基因组变异的常见来源,也是引起人类疾病的重要原因。对标准品NA12878样本的变异位点(SNP和Indel)的检出情况进行分析,比对预期的变异数量,V2实际的变异检出情况与预期高度一致,即便在12杂的实验条件下,V2对SNV检测的灵敏度达到了99%,对Indel检测的灵敏度也接近90%(图3)。表明V2对SNV和Indel位点的检出准确可靠。
图3丨V2在MGISEQ-2000测序平台上可实现可靠的变异检测。
测评总结
以上为此次IDT埃德特xGen人全外显子V2 Panel在MGISEQ-2000平台上的实测结果展示。测试结果表明,xGen人全外显子V2 Panel无论是单杂还是多杂,在捕获效率、覆盖均一度、数据利用率以及变异检出准确度等方面均展现出稳定且优异的性能。MGISEQ-2000基于DNBSEQ专利技术,可以稳定获得高质量的测序数据,测序结果具有低重复率特性,在需要高深度测序的应用场景下可以大大降低测序数据量,降低测序成本。该测评实验使用了华大智造的MGISP-100自动化建库平台,可一次性完成最多16个样本自动化建库,相比手工建库,自动化建库效率更高,数据表现更稳定,为后续杂交捕获实验提供了高度均一的文库。
IDT埃德特未来将进一步与华大智造合作,各自发挥优势,在MGISEQ-2000以及DNBSEQ-T7等平台开发出更多优秀的产品,为客户提供从文库构建、靶向捕获、上机测序到生信分析的全流程产品。
IDT埃德特
xGen人全外显子V2 Panel产品介绍:
IDT埃德特xGen人全外显子V2 Panel由415,115条单独合成单独质检的的5'生物素修饰的寡核苷酸探针组成。探针组跨越人基因组的34Mb目标区域(19,433 个基因),并且覆盖39Mb的探针空间(即由探针覆盖的基因组区域)。探针组中的所有探针均严格按照ISO13485标准进行生产。探针使用全新的“目标感知"(target aware)算法进行设计,并进行了专有的脱靶分析,确保在保证高中靶率的同时实现理想的目标覆盖度。在生产上,IDT埃德特xGen人全外显子V2 Panel含有的每条探针均经过质谱法(电喷雾电离质谱,ESI-MS)和双重定量测量检验,确保每条探针的核苷酸序列准确,并在探针库中具有符合预期的代表性。在设计上,V2的区域设计使用了更新更准确的全外显子参考基因组信息,并且搭配了IDT专有的生物信息学设计工具,以便实现更均一,完整性更好的区域覆盖。IDT埃德特xGen人全外显子V2 Panel适配灵活的多个样本混合策略(从1到12杂),通过始终如一的深度覆盖,以更低的测序成本提供更为优质的测序数据,助力人类疾病的机理研究。