Sanger测序的原理(sanger测序是什么)

1.桑格2.4543.固体4.HiSeq20005.赫利科斯6.DNA纳米球阵列7.PacBio遥感系统8.precision-guidedmunition精密

Sanger测序的原理(Sanger简介)插图

1.桑格

2.454

3.固体

4.HiSeq2000

5.赫利科斯

6.DNA纳米球阵列

7.PacBio遥感系统

8.precision-guidedmunition精密制导武器

9.MiSeq

桑格

企业:生命科技

推出:1977年发明,1986年第一台商用音序器。

主流型号:3730XL

样品要求:PCR产物:浓度≥50ng/ul,体积≥10ul;质粒:含量≥5ug;细菌:体积≥1ml。

排序原则:

双脱氧链终止法:Sanger测序的原理是,每个反应包含所有四种用于扩增的脱氧核苷酸三磷酸(dNTP)和有限量的一种不同的双脱氧核苷酸三磷酸(ddNTP)用于终止。由于ddNTP缺少延伸所需的3’-OH基团,延伸的寡核苷酸选择性地终止于G、A、T或C,终止点由反应中相应的双脱氧决定。可以调节每个dNTPs和ddNTPs的相对浓度,从而可以从反应中获得一组相差一个碱基的片段。它们有一个共同的起点,但终止于不同的核苷酸。高分辨率变性凝胶电泳可分离出大小不同的片段,凝胶处理后,可采用x光胶片放射自显影或非同位素标记进行检测。

文库的制备:不一定要建文库,质粒、菌液、PCR产物都可以提供。

模板制备:PCR扩增

长度:500-1000bp

测序通量:

四种测序方法的日通量:

短片段序列为36 cm 36 min 500 BP 1,728,500 BP天;

36cm 60min和700bp快速测序1,440,000 BP/天;

标准测序是36cm 90min 800bp1,113,000 BP/天;

长片段测序50cm120min分钟,1100 BP 1002000 BP/天。

(36cm指毛细管长度,36min指反应时间,500bp指反应的读数长度;)

时间/运行:36分钟-2小时

基础准确率:99.999%

检测能力(在DNA重测序中):

杂合子插入和缺失、微卫星、SNP、AFLP、T-RFLP和杂合性缺失分析

AFLP:扩增片段长度多态性,;

T-RFLP:末端限制性片段长度多态性;

贷款分析:杂合性的丧失;

成本:每台机器95000美元,每个反应大约4美元,每个反应800 bp,

数据格式:*。bcf*.abl

分析软件:

数据收集软件v2.0(随机器提供)

管理您的仪器设置,控制仪器操作,允许实时数据可视化,并执行诊断。新功能包括:

-使用GeneMapper v3.5版和SeqScape v2.1版进行自动分析

-符合FDA 21 CFR第11部分(针对美国客户)

-在染料组选项中使用任何选项的灵活性

-覆盖更多应用的额外优化测序运行模块

序列分析软件V5.1

设计用于基本呼叫;分配质量值;使用知识库basecaller整理、显示、编辑和打印DNA测序数据

序列拼接和比较基因分析软件Seqscape v2.1

提供您执行重测序应用所需的一切,如VariantSEQr重测序系统

自动基因片段分析软件GeneMapper v3.5

支持可配置的自动化等位基因calling - a plus,用于高通量基因分型,包括用于SNPlex数据分析的工具

SNP分型数据管理软件Bio Trekker v1.0(可选的数据挖掘工具)

提供了一种快速、强大的方法来搜索、检索和管理数百万种基因型

优点:测序金标准,阅读长度长

缺点:通量低,成本高

经典案例:桑格测序是测序技术的金标准,文章很多。

注意:由于测序方法的限制,无法保证10bp~40bp后测序引物的准确性。

454

企业:罗氏

于2005年推出

主流型号:基因组测序仪flx titanium(2008年推出)

样品要求:5μg DNA,浓度≥300 ng/μL

测序原理:焦磷酸测序

测序时使用了一种叫做“微微量滴定板”(PTP)的板,它含有160多万个由光纤组成的孔,孔中装载了化学发光反应所需的各种酶和底物。测序开始时,将置于四个独立试剂瓶中的四个碱基以T、A、C和G的顺序循环到PTP平板中,每次仅进入一个碱基。如果碱基配对发生,就会释放出一个焦磷酸。这种焦磷酸在各种酶的作用下,经过合成反应和化学发光反应,最终将荧光素氧化成氧化荧光素,同时发出光信号。该反应释放的光信号被仪器配备的高灵敏度CCD实时捕捉。当碱基与测序模板配对时,分子的光学信号将被捕获。有了这种一一对应,就可以准确快速的确定待测模板的碱基序列。

制备:片段(300-800 bp),配对

模板制备:微乳液PCR

长度:400bp

测序通量:0.4-0.6 Gb/次

时间/运行:10小时

碱基的准确性:Q20阅读长度为400个碱基。

检测能力(DNA重测序:SNP,Indel,SV,CNV

成本:仪器500,000美元/套,测序5600美元/整板

数据格式:原始数据:SFF格式

分析软件:GS De Novo汇编软件;GS参考映射软件;GS扩增子变体分析仪软件

优点:突出的优点是阅读长度长,使得后续的序列拼接工作更加高效准确。快,一个测序反应需要10个小时,得到4-6亿个碱基对。

缺点:无法精确测量均聚物的长度,因此检测插入缺失突变的错误率高;通量低,成本高。

经典案例:南部非洲的1.com·普莱特·科伊桑和班图基因组。Schuster sc等人(2010年)《自然》463 (7283): 943-7。

(详见https://www . Roche-applied-science . com/sis/sequencing/genome/index . JSP)

备注:特别适用于从头拼接和宏基因组学应用,多用于新的细菌基因组。重排序太贵了,不适合。

固体

企业:生命科技(2008年ABI和Invitrogen合并为生命科技公司)

于2007年推出

主流型号:Solid 4.0(2010年推出)

样品要求:

片段文库10 ng-5 μg

成对末端文库10 ng-5 μg

配对文库5 μg-20 μg

排序原则:边连接边排序。

测序引物和接头可以互补杂交,它们的5’端可以连接与相邻序列互补的寡核苷酸。八聚体寡核苷酸可以竞争性地连接到引物上(寡聚物的第四和第五个位置是荧光标记位点)。当读取到标记颜色时,在第五位和第六位之间切割附着的寡核苷酸,去除标记,进行下一步反应,如此循环往复。第一轮反应,确认的碱基位点有:4,5,9,10,14,15碱基等。重复反应过程,移一个碱基,用比第一轮少一个碱基的引物反应。已确认的碱基位点包括:3、4、8、9、13、14等。等等,直到它转移到引物的第一个碱基(即待测序列0位点的碱基)。因为这个位点的碱基是已知的,所以通过读取的荧光颜色就可以知道位点1的碱基类型,然后通过位点1的荧光颜色就可以推断出位点2的碱基类型,以此类推,直到完成整个序列读取。

图书馆的准备:

配对文库(插入600 bp至10 Kb)

双端文库

片段库

模板制备:微乳液PCR

长度:2*50 bp

测序产量:100-120克/次,12克/天

时间/运行:7~12天

基础精度:原始基础数据精度大于99.94%,在15X覆盖深度下精度可达99.999%。

检测能力(DNA重测序):SNP,Indel,SV,CNV

成本:仪器49.5万美元/台,测序6000美元/100Gb。

数据格式:原始数据:*csfasta和* quel对比格式:BAM/SAM。

分析软件:分析软件:Bioscope,经过对比很多第三方软件都支持。

优点:准确性高,每个DNA碱基检测两次,增加了序列读取的准确性。

缺点:检测碱基置换突变运行时间长,错误率高。

经典案例:固体测序技术仅在DNA应用方面发表的文章就有60篇,其中在Science/Nature及其子期刊上发表的高水平文章有15篇,其中de nove测序文章3篇,靶向重测序文章26篇,全基因组重测序文章31篇。固体也广泛应用于RNA、外观等文章中。

备注:行业领先的精度实现了重要生物变异检测,适用于全基因组重测序、定向重测序和全转录组分析。

HiSeq2000

企业:Illumina

上市日期:2010年1月1日

主流型号:Illumina HiSeq2000

样品要求:6ug/样品,无RNA和蛋白质污染,无降解,OD260/OD280=1.8-2.0。

测序原理:边合成边测序。

这种测序技术将基因组DNA的随机片段附着在光学透明的表面上,这些DNA片段被延伸和桥接扩增,形成具有数亿个簇的流动池,每个簇具有大约1000个拷贝的相同DNA模板,然后使用4个不同的荧光标记的末端封闭的碱基进行合成和测序。这种新方法确保了高准确性和真实的逐碱基测序,消除了序列中的特殊错误,并且可以对均聚物和重复序列进行测序。该技术将基因组DNA随机片段附着到光学透明表面上。并且通过DNA片段的延伸桥扩增,它产生具有& gt1000万个集群,每个集群包含大约1000个相同模板的副本。然后用四种带有不同荧光标记末端封闭的碱基合成测序。该技术保证了高精度和逐个碱基测序,避免了特殊的测序错误,可用于重复测序和均聚物。

制备:片段,配对(200bp-40kb)

模板制备:桥扩增

长度:50SE,91PE,101PE等。

测序产量:25G/天

时间/运行:

91/101PE,8-10天;

50SE,3天;

150PE,15天;

一般来说,不同的策略有不同的时间。

基底精度:Q30 %≥80%;Q20%≥90%

检测能力(DNA重测序):SNP,Indel,SV,CNV

成本:每台机器69万美元,每个人类基因组测序(30倍)6000美元

数据格式:排序结果:*。FQ;比较:*。SOAP/*。BAM/*。山姆;变异:*。gff

分析软件:GenomeStudio或第三方软件包;选择

优点:高通量,灵活的测序模式,多样化的分析软件。

缺点:目前成本高于第三代测序,样品制备过程复杂,对样品要求比较高。

经典案例:多发性骨髓瘤的初始基因组测序与分析。查普曼马,等自然。2011年3月24日;471(7339):467-72.

保留细胞质内含子序列的转录本可以通过ID元件反转录转座子被树突靶向。巴克利角,等神经元。2011年3月10日;69(5):877-84.

配对末端RNA测序鉴定乳腺癌融合基因。基因组生物学。2011年1月19日;第12条(1):R6。

未测序大麦基因组中候选多态性解析的全基因组关联作图。Cockram J,等,《美国国家科学院院刊》, 2010年12月14日;107(50):21611-6.Epub 2010年11月29日。

II类反式激活因子CIITA是淋巴样肿瘤中的一种复发基因融合伴侣。《自然》, 2011年3月17日;471(7338):377-81.Epub 2011年3月2日。

通过单细胞测序推断肿瘤演变。《自然》, 2011年4月7日;472(7341):90-4.Epub 2011年3月13日。

备注:是目前市面上最主流的测序仪,有很多演示案例;此外,额外的好处是实验的灵活性——需要不同读取长度的应用可以在每个流动池中运行——例如,全基因组测序和从头测序研究(例如人类和微生物)可以在一个流动池中以2 x 100bp的读取长度运行,而另一个可以在1 x 50bp的读取长度运行ChIP-seq和基因表达样品。每个流通池都是独立控制的;因此,运行的开始/停止可以相互独立。

赫利科斯

企业:Helicos生物科学公司

于2008年推出

主流型号:Heliscope单分子测序仪(2008年推出)

样品要求:1-3 μg,初始DNA体积不应超过100μ l .

测序原理:边合成边测序,可逆阻断测序。

将待测DNA随机断裂成小片段,在每个小片段的末端(~200 bp)加入poly-dA,在玻璃芯片上随机固定多个poly-DT引物,poly-dT引物末端都有荧光标记,便于准确定位。首先将小DNA模板与检测芯片上的poly-dT引物杂交并精确定位,然后逐一加入荧光标记的末端终止子。这个终结者和Illumina的终结者不一样。它不是四色而是单色的,这意味着所有的终止子都用相同的染料标记。在掺杂单个荧光标记的核苷酸后,洗涤,单色成像,然后切割荧光染料和抑制基团,洗涤,加帽,并允许下一个核苷酸被掺杂。通过掺杂、检测和切除的重复循环,可以实时读取大量序列。最后,在软件系统的帮助下,可以分析完整的核酸序列。

准备:片段,配对

模板制备:单分子检测

长度:25-55 bp,平均35 bp

测序通量:21至35gb/次

时间/运行:8天

碱基的准确性: >:在20倍覆盖率下,一致性超过99.995%。

检测能力(DNA重测序):SNP,CNV

费用:仪器99.9万美元/台,测序0.45-0.60美元/兆碱基。

数据格式:原始数据:srf或sms格式

分析软件:推荐使用Helisphere开源软件进行筛选对比。

优点:真正的单分子测序,无需前置扩增,无偏倚;特别适合RNA-Seq或RNA直接测序应用,因为它可以直接对RNA模板进行测序,而无需将其转化为cDNA。检测碱基置换突变的错误率很低,~0.2%。

缺点:错误率高,插入1.5%,删除3.0%;Heliscope在面对均聚物时会遇到一些困难,但通过二次测序可以提高准确性。因为未标记的碱基可能混合在合成中,所以主要的误差来源是缺失。

经典案例:1。单个人类基因组的单分子测序。

Dmitry Pushkarev,Norma F Neff & amp斯蒂芬·雷神之锤。纳特生物技术公司,27岁。(9): 847-852.

(有关更多详细信息,请参见。

http://www . helicosbio . com/helicospherecenter/publications library/helicossscientific publications/tabid/169/default . aspx)

备注:特别适合RNA-Seq或RNA直接测序的应用。

DNA纳米球阵列

企业:太平洋生物科学公司

发射日期:2009年底发表科学论文,2010年发射。

主流模型:DNA纳米球阵列

样本要求:DNA包括

PicoGreen定量:推荐10ug,至少7.5ug浓度:75-150 ng/ul;体积:50-200 ul;DNA的长度:高分子量双链基因组DNA,大部分超过20kb。

排序原则:边连接边排序。

采用高密度DNA(玻璃板)纳米芯片技术和不连续、非连接的组合探针锚定连接(cPAL)技术进行测序。基因组随机断裂成500bp随机长度的片段,两端连接,成环,限制性内切酶消化,重复两次,最后连接成DNA环。目前4接头文库构建方法可以支持70bp单端测序(35bp双端测序)。然后,如图所示,每个DNA环在反应溶液中高速扩增以形成纳米球(DNB ),使得每个DNA环扩增约200倍。然后,将这些纳米球平铺在预处理过的玻璃板上,形成纳米芯片。最后,通过非连接组合探针锚定连接(cPAL)技术进行测序。10bp探针上有一个锚定碱基(A或T或G或C),其他位置都是n。通过与模板的杂交连接反应,根据四个不同的碱基(A/T/G/C)会有四个不同的荧光信号,总共需要40个不同的锚定探针。杂交后每个锚定探针将被洗脱。通过DNB芯片的荧光显色结果和解码分析,可以确定每个DNB的核酸序列。

文库的制备:500bp

模板制备:纳米球(DNB)

长度:35PE

测序通量:20-60G/次/流片,共18个流片。

时间/运行:9天

基础准确率:99.999%

检测能力(DNA重测序):SNP,Indel,SV,CNV

费用:只提供测序服务,不卖仪器。2009年11月的WGS成本为1726美元(45倍)、8005美元(87倍)。

数据格式:基本文本格式,*.tsv .可交付结果包括:序列变异、功能注释、数据总结报告以及上述结果的一组支持数据。

数据由三部分组成,主要部分是读取和映射,其次是组装和变化,摘要报告最少。

分析软件:基因组比较工具

格式转换工具

注释工具

参考工具

在开发中,还有用于癌症基因组分析的肿瘤-正常样本比较工具和用于家族基因组分析的工具,以及可以同时比较数百个基因组的大规模比较工具。完整的基因组装配流水线版本1.5.0

优点:测序自动化,低成本,高通量。

缺点:阅读长度,分析软件不开放,样本要求高。

经典案例:通过全基因组重测序鉴定严重高胆固醇血症的基因缺陷责任。人类分子遗传学,第19卷,第22期,第4313-4318页。

在自组装DNA纳米阵列上使用非链式碱基读取进行人类基因组测序。Radoje Drmanac1等,《科学》,第327卷第5961期,第78-81页。

全基因组测序分析一个四重奏家系的遗传。Jared C. Roach等,《科学》,第328卷,第5978期,第636-639页

肺癌患者配对基因组序列揭示的突变谱。李浩等人,《自然》,第465卷,第473-477页

备注:作图读数:40x/基因组

PacBio遥感系统

企业:太平洋生物科学公司

发布时间:早期试验将于2010年2月开始。

主流型号:PacBio RS

样品要求:1kb以下500ng,纯化的基因组DNA,BACs,c DNA文库或PCR产物。

测序原理:边合成边测序,单分子,实时,orsmrt,技术

这项技术的核心是使用零模波导(ZMW)(零带边界)。测序平台上有几万个孔,每个孔里固定着单个DNA聚合酶和待测序的DNA链。将荧光标记的脱氧核苷酸(A、T、C、G)加入每个孔中。每种脱氧核苷酸在激发后都能发出不同波长的荧光。小井底部开一个很小的孔,比探测激光的单波长还要小。按照我们的常识,这个洞太小,激光无法穿过井底,无法激发脱氧核苷酸上的荧光物质。所以,底部的显微镜检测到的是黑暗。但是我们知道光是一种波,它会发生衍射。激光虽然不能通过孔洞完全照亮整个井,但也能通过孔洞勉强照亮孔洞附近的一小块区域。而DNA聚合酶正好固定在这个小区域。当单个脱氧核苷酸被装载到DNA聚合酶上形成新的化学键时,这个脱氧核苷酸上的荧光物质被激活而发光,这是通过显微镜观察到的。这种特定颜色的荧光只持续很短的时间,因为这个碱基在DNA链上合成后,它的荧光基团会被切断,从而继续下一个碱基的合成。当DNA链合成完成时,DNA链测序也完成了。而DNA聚合酶的活性在激光的照射下会逐渐减弱,合成反应不可能无限进行,所以DNA链的测序长度是有限的。

制备:片段,配对(250bp-6kb)

模板制备:SMRTbell文库,无常规扩增。1kb以下的库只需要500ng样本。

长度:1000bp

测序通量:高灵活性测序通量。

时间/运行:模板为初级碱基调用分析做准备不到一天,通常不到4小时。

基础准确率:准确率社会评价不高。2011年1月出版的NEJM杂志(关于海地霍乱的测序)在其增刊中提到,其单碱基准确率仅为81-83%。

对其准确性的社会评价并不好。有些网站说它的准确性很差。单次测序的平均错误率为15%,循环测序后下降到8%。

检测能力(DNA重测序):SNP、Indel、SV、CNV,可以直接修改测序,比如甲基化,方便表观研究。

成本:每台机器70万美元,每个smrttmcell 99美元,每个都有15000个ZMW,每个ZMW都含有一种DNA聚合酶。

数据格式:bas . H5-基础文件和过滤基础文件-文档

CMP . H5-参考映射文件和共识文件-文档

分析软件:mapping: blasr(成功细化的基本线性比对);汇编:allora(一个长读汇编程序);以及SNP indel: rccs(参考循环一致测序)客户端软件:SMRT门户;;提供:包含主要和次要分析数据的行业标准输出格式的专家特定、数据丰富的报告。可以使用第三方软件。

优点:阅读时间长;不需要PCR扩增,有偏倚;也避免了由它引起的问题;所需的样本量非常少;样品制备时间少;RS系统可以远程快速获取数据和选择测序参数;通量灵活性;时间过得很快。

缺点:精度低,需要循环测序,

经典案例:海地霍乱爆发菌株的起源。364:33-42 2011年1月6日。

单个聚合酶分子的实时DNA测序。《科学》2009年1月2日:

第323卷,第5910号,第133-138页

DOI:10.1126/科学

备注:1。样品制备完成后,有一个运行设计步骤。可以在客户端电脑上使用RS远程软件自主选择操作模式和后续的个性化分析服务,第一时间接收测序数据。2.截至2011年5月,已有多家RS测序仪正式销售,包括美国国家生化防御分析与对策中心(NBACC)和冷泉港实验室。

precision-guidedmunition精密制导武器

企业:离子洪流

推出日期:2010年

主流型号:Ion个人基因组机器(2010年)

样本要求:5g DNA,初始DNA体积不得超过130 L。

测序原理:半导体芯片测序

定序器采用高密度半导体针孔芯片。芯片被放置在离子敏感层和离子受体上。每当一个核苷酸分子被掺杂,就会释放出质子,离子受体就会感受到这个信号,知道哪个核苷酸被掺杂,从而读出DNA序列。

制备:片段(185-210 BP)

模板制备:PCR扩增

阅读长度:

14芯片,100bp

16芯片,100bp;

38芯片,200 bp。

测序通量:

14芯片,10mb/run;

16芯片,100 MB/run;

38芯片,1Gb/运行。

时间/运行:2小时

基础精度:一致性超过99.99%,>:99.5%原始精度。

检测能力(DNA重测序):SNP,Indel

成本:仪器50,000美元/套,测序500美元/次

数据格式:标准SFF或FASTAQ格式

分析软件:对一系列商业软件进行变异测试,并重新组装。

优点:测序工作可在2小时内完成,速度无与伦比;Ion Torrent的化学测序原理自然简单,不需要修饰核苷酸,不需要激光或光学检测设备,因此可以实现最小的测序偏差和优异的测序覆盖平衡。

缺点:目前测序通量不够大,增加半导体芯片的容量将有望提高测序仪的处理能力。

经典案例:1德国爆发大肠杆菌疫情后,华大基因利用第三代测序仪——Ion Torrent对大肠杆菌全基因组进行了测序。在获得病毒样本后的三天内,华大基因完成了新型大肠杆菌的基因组测序..经初步信息分析,发现该菌株是一种新的大肠杆菌,具有侵袭、产毒素和肠道出血的特性。

备注:特别适用于微生物基因组测序和扩增子重测序。

MiSeq

企业:Illumina

发布日期:2011年

主流模式:miseq个人测序系统(2011年)

样本要求:Nextera,50ng DNA使用了100 ng-1 g DNA。

测序原理:边合成边测序。

这种测序技术将基因组DNA的随机片段附着在光学透明的表面上,这些DNA片段被延伸和桥接扩增,形成具有数亿个簇的流动池,每个簇具有大约1000个拷贝的相同DNA模板,然后使用4个不同的荧光标记的末端封闭的碱基进行合成和测序。这种新方法确保了高准确性和真实的逐碱基测序,消除了序列中的特殊错误,并且可以对均聚物和重复序列进行测序。

准备:碎片

模板制备:桥扩增

阅读长度:

1*35个碱基

2*100 bp

2*150 bp

测序通量:

1 * 35bp & gt;120 Mb/次

2 * 100 bp & gt680 Mb/运行

2 * 150 bp & gt1gb/运行

时间/运行:

总扩增测序时间:

1*35 bp 4小时

2*100 bp 19小时

2*150 bp 27小时

基本精度:

& gt在1*35 bp处比Q30高90%碱基

& gt在2*100个碱基处比Q30高80%

& gt在2*150个碱基处比Q30高75%

检测能力(在DNA重测序中):

费用:不适用

数据格式:仪器125,000美元/套,测序750美元/次

分析软件:*。bcl,FASTQ,BAM,*。vcf和*.csv。

优点:样品制备简单快速,测序和数据处理可在一台仪器中完成;可靠的化学方法,可逆的终止碱基测序和合成。

缺点:不适用

经典案例:不适用

备注:它特别适用于扩增子测序、克隆检查和小基因组测序。

来源:生物文摘

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/309148.html

发表回复

登录后才能评论