人类基因组研究成果(人类基因组研究成果怎么写)

图片来源:T. Potapova和J. Gerton/Stowers医学研究所

人类基因组研究成果(人类基因组研究成果怎么写)

自1990年以来,我们一直在接近完整的人类基因组。今天,在《科学》杂志上发表的六项新研究中,科学家解决了最关键的测序问题,获得了完整的人类基因组序列,或将我们对人类生长、发育和疾病的认识推向了一个新的高度。

人类细胞中通常有23对染色体。如果你仔细观察这些染色体,你会发现组蛋白和DNA缠绕在上面。我们的DNA是由ATCG4碱基组成的,生命的密码就藏在其中。人类基因组包含约30亿个碱基对,排列极其复杂但有规律,因为人类基因组之间的相似度高达99.9%。多年来,科学家们一直试图借助这些定律来了解人体的工作原理,尤其是与疾病有关的机制。

1986年,《科学》杂志发表了诺贝尔生理学或医学奖获得者雷纳托·杜尔贝科的一篇文章。他认为,癌症研究已经到了一个临界点:要么零碎地挖掘一些关键的癌症基因,要么确定一个特定物种的完整基因组。为了征服人类癌症,有必要确定人类基因组,了解参与关键生理和病理过程的基因。

同年,杜尔贝克和其他科学家共同发起了人类基因组计划——人类核基因组全测序。1990年,这一项目正式启动,被誉为生命科学领域的“登月工程”。又过了14年,2004年,人类基因组第一个测序结果发表,但基因组中仍有约2亿个碱基未知,占全部序列的8%。这些未知序列包含了很多高度重复的碱基序列,由于当时的技术,很难破译。

此后,科学家们发布了越来越多的完整人类基因组序列。到2017年,图谱上的缺口已经不到1000个,但人类基因组仍然没有“完成”。

今天,一个由近百名研究人员组成的国际科学组织——端粒-端粒(T2T)联盟在《科学》杂志上发表了6篇论文,称他们检测到了那些高度重复的DNA序列,获得了迄今为止最完整的人类基因组T2T-CHM13,包括30.55亿个碱基对,由22条常染色体和X染色体无缝组装而成。此时基因组只有5个缺口,这项研究也被认为是第一次完整的人类基因组测序。

与2017年发布的基因组GRCh38相比,T2T-CHM13包含了更完整的基因组。图片来自研究论文

突破难题为了获得完整的基因组,团队必须首先解决测序中的一个难题:人体中的大多数细胞都包含两个基因组——一个来自父亲,一个来自母亲。当研究人员组装DNA片段时,男女父母的序列会混合在一起,无法确定某个基因组中的实际变异。

因此,研究小组使用了20多年前从一名妇女的子宫中切除的异常生长的匿名细胞系。这名妇女经历了一次妊娠失败——精子进入了一个没有染色体的卵细胞。如果受精卵中只有精子的遗传物质,就不能长成胚胎,但还是可以繁殖的,尤其是当精子携带X染色体的时候。

一个不正常的受精卵的优点是它只包含一个基因组,23对染色体成对相同。帮助领导人类基因组计划的华盛顿大学遗传学家罗伯特·沃特斯顿(Robert Waterston)表示,这将对填补基因组空白有很大帮助,因为测序仪不再需要解决父母染色体不同的问题。

另外,还有一个更重要的难点,就是高度重复的序列。在基因组测序时,科学家通常需要将DNA切割成更短的片段,逐个进行测序,然后将测序结果拼凑在一起。当遇到大量高度相似的序列时,研究人员很难确定它们之间的顺序。因此,科学家需要使用更先进的技术来一次测量更长的DNA序列,以减少拼接的需要。

因此,T2T联盟的科学家们使用了许多尖端的测序技术,包括一个可以读取10万个碱基的纳米孔测序设备和一个更精确的测序仪,一次只能读取大约1万个碱基。将这些方法一起使用,团队几乎消除了所有的基因组问题,只留下了5个缺口,总计约1000万个未知碱基。此外,由于该细胞系中只有常染色体和X染色体,因此需要详细分析Y染色体的碱基序列。

首次确定的序列

此次,研究团队为基因组填充了约2亿个碱基,主要位于着丝粒区和近着丝粒染色体的短臂区,以及许多长度超过1000个碱基的大重复序列。这些序列包含1900多个基因,其中大部分是已知基因的拷贝,但也包括182个新基因。

研究小组在着丝粒上发现了一种特殊的序列,它可以与一种叫做“动粒”的蛋白质复合物结合,“动粒”参与了染色体运动的调节和染色体分裂的过程。一旦这个序列发生突变,可能会影响细胞中的基因表达,导致癌症。

染色体有4种类型,其中从左至右3种为中着丝粒染色体。这条染色体的短臂很短。图片来自Vedantu

科学家还发现,着丝粒区域存在异常高水平的变异。根据他们的分析,着丝粒及其附近区域呈现“分层扩散”的进化模式,即存在重复但突变的序列,新的序列会与旧的序列连接,而旧的序列会被新的序列挤压到边缘,慢慢变短。

此外,对5条着丝粒染色体短臂区域的测序结果显示,这些短臂区域含有多个拷贝的编码核糖体RNA的基因,共有400个拷贝。更重要的是,短臂区变异程度高,存在大量重复序列,如移动转座子。研究小组认为,短臂区域很可能是基因进化的热点,因为留在那里的基因拷贝可以自由变异,获得新的功能。

图片右侧的染色体包含两个姐妹染色单体,它们的连接处是着丝粒。

科学家们非常重视基因组中的重复序列,并对它们进行分类。在这些序列中,碱基的化学修饰可能与许多疾病有关,如一些神经系统疾病和发育障碍。而那些疾病的出现,通常与一些重复序列的拷贝数变化有关。

后续的计划

毫无疑问,这种新的人类基因参考图谱将对基因组分析产生巨大影响。它将更好地支持个性化医疗、人群基因组分析和基因组编辑。“即使在5年前,我们也没有想到能够做到这一点,更不用说10年前了,”生物信息学家、欧洲分子生物学实验室副主任伊万·伯尼(Ewan Bernie)说(他参与了人类基因组计划,但没有参与这些研究)。这些研究非常出色。“基因编辑公司Inscripta的基因组学科学家Deanna Church认为,这些以前未知的DNA区域给了我们更多关于基因组的新知识。

虽然这些新的研究工作使基因组测序成为一个新的里程碑,但人类基因组测序仪并没有完全下班。由于使用的细胞系没有Y染色体,T2T联盟的科学家获得了哈佛大学系统生物学家Leonid Peshkin的基因组,并对他的一条Y染色体进行了测序。此前,佩什金博士的基因组已经得到了比较充分的研究,但尚未获得完整的基因组序列。好消息是,昨天,T2T联盟在推特上宣布,他们已经确定了Y染色体上缺失序列的正确排列。想必离解离沉淀出一个完整的Y染色序列也不远了。

此外,人类基因组计划的联合负责人、贝勒医学院的遗传学家理查德·吉布斯(Richard Gibbs)说,“还有一些工作要做。”包括他在内的许多研究人员强调,现在需要从更多样化的人群中获得完整的基因组序列,寻找染色体短臂中可能的变异以及测序难度更高的其他区域的变异,因为这些可能与疾病或其他性状有关。

此外,他们还有一个新目标——从不同种族或血统的人身上提取350个基因组(目前已解码70个基因组)。这些基因组是人类泛基因组参考联盟的一部分,它们的测序更具挑战性,因为每对染色体都是不同的。最后,科学家希望找出每个基因组从端粒到端粒的完整序列。

作者:Chestnut,cle寓言

参考链接:

https://www . science . org/content/article/最完整的人类基因组揭示了以前无法破译的dna

https://www.science.org/toc/science/current

https://www.science.org/doi/10.1126/science.abj5089

https://www.science.org/doi/10.1126/science.abk3112

https://www.science.org/doi/10.1126/science.abl4178

https://www.science.org/doi/10.1126/science.abo5367

https://www.science.org/doi/10.1126/science.abj5089

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/321697.html

发表回复

登录后才能评论