您现在的位置：首页 / 资讯

访谈| 华大智造首席科学家Rade Drmanac: 基因不是命运，是微妙的程序（中篇）

时间：2019-08-27作者：华大智造

Radoje（Rade） Drmanac 博士，华大智造首席科学家，Complete Genomics 联合创始人，人类基因组测序领域科学家，他发明了多项技术，包括DNA杂交测序（SBH）、基因组微阵列和纳米阵列、联合探针锚定聚合技术和长片段读取（LFR）技术等。他早年在贝尔格莱德大学（Belgrade University）获得分子生物学学士、硕士和博士学位，在伦敦帝国癌症研究基金会的汉斯·莱赫拉的研究小组完成博士后研究，1991年至1994年期间担任阿贡国家实验室组长，1994年，合伙创建Hyseq（后来的Nuvelo）。

在上一期（华大智造首席科学家Rade Drmanac: 基因不是命运，是微妙的程序（上篇））的采访中，Rade 谈及他如何与测序技术结缘，测序技术又为日常生活带来哪些变化，本期，他将与大家继续分享测序技术的未来发展情况。

您如何看待未来测序技术的发展？

这是一个非常值得探讨的话题，想想我们过去使用毛细管甚至凝胶测序开始只能测少量样本的时刻，当前测序技术已经取得了惊人的进展。在本世纪初，我们要花费10亿美元进行全基因组测序；到了2010年，Complete Genomics第一次在《科学》杂志上发布一次全基因组测序的材料成本可以降低到五千美元。那时，还有一批类似Solexa一类的公司在做类似的事情，当时他们的测序价格为五万美金。现在回看，CG所做的事情是巨大的突破，因为这使得测序成本降低了10倍之多。从那时候开始，测序成本开始数十倍地降低，我坚信未来测序成本会持续下降，而华大智造会成为百美金基因组的引领者。

为什么“百美元基因组”如此地重要？这并非指一个人基因组价值不超过一百美元，在我看来完成一个人的测序并且终身使用它，我想这价值数万到数十万美元。但“百美元基因组”背后是人们是否支付得起的问题，仍然有很多人无力为自身极为重要的遗传信息支付上千美元。

当我们有低成本的基因组时，就可以聚合起巨大的数据库，多数时候人们认为百万人口已经足够，但在我看来应当是数十亿，类似这样庞大的数据库有助于逆向工程以及对推动我们对基因程序，对人类如何运行有全方位的理解。人体、基因是个复杂的程序，但我们知道但我们知道我可以理解它，以及做逆向工程, 去理解某个基因的变异所代表的确切含义。因此，要做这种大规模的项目，我们需要非常庞大的组学数据库，然后也包括人工智能。

测序技术的未来一定是进一步地降低成本，提高通量和质量。我想MGISEQ-T7就是达成这个未来的绝佳范本，未来华大智造也不会止步于此。华大智造DNBSEQ?是当今最好的大规模并行高通量技术之一，因为DNA纳米球非常小，直径大约只有200纳米，所以我们可以排布更高密度的阵列，在同一表面上承载更多信息。MGISEQ-T7上纳米球的间距大约是700纳米之后我们会不断缩短间距，只有这样才能在同样面积的载片上、同样体积的试剂上，获取更多的信息。TB (Terabase) 级别的测序成本已经变得越来越低。除此之外，纳米球在200纳米内有300份拷贝，相对于PCR簇，拥有更高的信噪比。

测序技术发展的另外一个方向一定更注重测序的质量。目前我们所用的标记核苷酸和聚合酶在聚合时存在一定的困难。虽然我们优化的酶做得很好，尽管如此，有时标记核苷酸和聚合酶之间仍有冲突，特别是去除荧光染料时。会有一些原子如同一道疤痕留在碱基中，这样就不再拥有无损碱基。

因此在几年前，我们提出了一种全新的测序方式，一个新的化学方法，在这个方法中，我们将未标记的核糖核酸与四色荧光标记来识别碱基，没有任何标记，也没有碱基修饰，我们将这个技术称作“CoolNGS”或者是”CoolMPS (cool massively parallel sequencing)”。“cool” 意味着我们不必使用带有标记（hot）的核苷酸, 而是使用未标记（cold）的核苷酸。当我跟乔治· 丘奇和其他科学家描述这个化学方法的时候，他们为这样的想法感到兴奋。在我描述这一切的时候，他们觉得“ 很酷（cool）！” 这就是CoolNGS (CoolMPS) 名字的由来。我想，这是代表高通量测序技术未来发展方向的一个例子，我们已经通过实验证明这一技术能够极大地提升测序的读长与精准度。在提高精确度以及提供高通量、低成本的测序之后，所需要做的就是开发更多的应用。

我们拥有很多的优势，因为我们在生成DNA纳米球时不使用PCR，我们使用的是滚环扩增技术，在滚环复制中，具有链置换功能的RCA聚合酶始终基于原始模板进行数百次的拷贝，我们的技术不是传递复制，这也是唯一不产生克隆错误的高通量测序技术。这些克隆错误是可以被检测的，如果在一个纳米球的300份拷贝中有一份出现错误，没有关系，我们可以从其他299份中检测到正确的信号。

现在我们拥有“真“、”正“ PCR-free的技术”，结合PCR-Free文库制备方法，首次实现了PCR-Free的全基因组测序。接下来，会有更多的应用采用这种真正的PCR-Free测序技术，例如RNAseq或者微生物组。为什么DNBSEQ?技术能够做到真正的PCR-Free测序? 原因是DNB加载到阵列式载片的效率极高。在测序文库制备过程中，80%的文库分子可以环化成单链环状DNA，其中95%的单链环状DNA可以生成DNBs，然后90%的DNBs可以被加载到测序芯片上。这样，超过50%的原始模板分子可以被测到。正因如此，我们完全无需扩增模板分子的步骤, 就可以直接对原始模板进行环化，生成DNBs并测序。

该技术有望在其他类型的文库中得以应用，实现全流程无PCR的测序。基于DNBSEQ?平台的PCR-Free文库也不需要分子标签（unique molecular identifiers，UMIs）。UMIs主要的作用是为了避免PCR建库和PCR-cluster过程中引入的错误。由于PCR-Free的DNBSEQ?技术保证了每条read都是保真可用的，因此不需要使用UMIs来矫正PCR引入的错误。此外，由于DNBSEQ?技术使得标签跳跃（index hopping）发生的概率远低于其他测序平台，可以将上百个文库pooling到一个测序反应中，尤其适用于高通量样本的测序。

我们还开发了stLFR技术。这是我们几年前提出的强大的分子标签技术，用于长片段DNA信息获取。当前我们能够以较低的成本对数十亿的片段进行测序，准确度虽高，但相对读长较短。所以，我们的想法是想以一种新的方式来进行高通量大规模并行测序，大家都知道，即使我们一次能够读500bp，长度仍然相对较短。因此，该技术的作用是使用长片段，例如100kb，200kb，在片段化的过程中添加测序分子标签，使来自该长分子的每个亚片段具有相同的分子标签。

我们将这个过程称之为共标记（co-barcoding），因为来自同一个长分子的所有小片段都获得相同的分子标签。这些子片段具有相同分子标签的。我们的stLFR技术，使我们第一次拥有几乎无限数量的分子标签，我们在微珠上创造了30亿个这样的分子标签，我们从三十亿个中选出上亿个分子标签，将他们与来自同一个样本的近千万条长DNA片段放在一个管内。

几乎每个长片段都会得到自己独特的分子标签，因为我们有更多的分子标签而不是长片段，一千万个条码就有一千万个长片段。这是我们第一次可以拥有独特的共标记， stLFR可以说是表现最佳的分子标签技术。它操作更为简单，不需要用油包水体系或特定仪器支持。它也很便宜, 实际上就像制作一个略高级的常规文库。但是，这种独特的分子标签首次允许我们做的是真正有效的单倍型-从头组装个人基因组。它可以提供臻于“完美”的基因组。现在我们可以很轻易地对数百个新物种，比如鸟类，动物和植物进行测序和基因组组装，不需要像以前一样花费一整年不停地构建各种不同的Mate-pair文库（配对大片段文库）。

我们可以看到stLFR技术催生了这类应用，加上纳米球，规则阵列，更好的CoolMPS化学方法集合到一起，给我们带来更高的质量，更低的成本，和更高的通量。影响精准医学发展的限制因素不会是DNA测序技术，这些限制有可能来自物流，医生问诊或样品采集，我始终相信我们在测序上将有无限的可能。

上一篇：封面新闻：与时间赛跑，帮科研工作者发现疾病的“罪魁祸首”丨70年70人下一篇：“绽放杯5G应用大赛”华大智造MGIUS-R3斩获二等奖