来源:原理
这幅巨大的“拼图”实际上就是国际上许多机构和科学家多年来一直在努力完成的作品,也就是人类基因组研究。
最近,这项浩大的工程又迎来了一个里程碑式的成就。科学家首次“从头到尾”(从端粒到端粒)确认了人类X染色体的完整序列,其中不存在任何缺口,它的精确度达到了前所未有的水平。这一成果也标志着,创造出精确到碱基的完整人类染色体已经成为现实,基因组学研究或许将迈入新的时代。
事实上,当我们说起人类基因组测序或者研究时,通常会有一些典型的“错觉”。比如,说到“人类基因组”这个词时,可能总觉得好像只有一种似的。其实我们每个人都有自己的基因组“副本”,而且每个副本都略有不同。
而在基因组研究中,通常会采用“参考基因组”的概念。参考基因组通常是一个由科学家组装的数字的核酸序列数据库,作为物种的一个理想个体的基因代表。
人类参考基因组最初来自一些匿名志愿者,基因组参考联盟(GRC)负责对参考基因组进行不定期地更新。2013年,GRC发布了最新的人类参考基因组GRCh38。尽管经过数十年的努力,目前的人类参考基因组是迄今为止最精确和完整的脊椎动物基因组之一,但它并非一个“一字不差”的完整基因组,其中的DNA序列仍然存在许多“缺口”等待着填补。
这就和另一个常见的“错觉”有关。当我们谈到对人类基因组测序,我们脑海里浮现出的画面可能是像“复印机”一样的场景——科学家把一个完整的基因组信息按顺序一点一点“印”出来。但事实却不是这样。
人类基因组非常长,包含约60亿个碱基。任何DNA测序仪器都无法一次性完全读取所有的碱基信息。因此,简单来说,研究人员需要把基因组分成更小的片段,就像把把一幅图画切割成拼图的一小块。然后,再对每一块的信息进行分析,最后把这些短片段拼回到整幅图中去。这也就是为什么科学家的工作更像是在“拼拼图”。
在这幅“拼图”中,DNA重复序列在基因组中非常普遍,它们一直是巨大的挑战。大多测序技术只能制造出长度很小的“短片段读取”,重复序列就会导致许多看起来几乎完全相同的短片段出现。这就好像在拼图中出现了一大片蓝天,这里的每一块看起来并没有什么不同,但又没有线索告诉我们这些片段是如何拼接在一起的,也没有线索说明片段重复了多少次。这就带来了许多“缺口”,也就是“丢失”的信息。
在这项新研究中,团队没有选择测序正常人类细胞中的X染色体。相反,它们使用了一种特殊的细胞类型。这种细胞包含两条完全相同的X染色体,它比一般的男性细胞(XY)多一条X染色体,同时又能避免分析典型的女性细胞(XX)时会遇到的两条染色体的序列差异的问题。
研究的第一作者KarenMiga在2018年曾参与一项研究,证明了纳米孔测序技术在创造完整人类基因组序列方面的潜力。研究使用的是一种特殊的纳米孔测序仪,它通过检测单个DNA分子通过膜上的小孔(纳米孔)时电流的变化,对DNA进行测序。
Miga介绍,这些重复性很高的序列曾经被认为十分棘手,但现在,测序技术取得了长足的进步。纳米孔测序技术可以获得包含数十万个碱基对的“超长读取”,这样的长度可以跨越覆盖整个重复区域,从而绕过了一些复杂的挑战。新的突破正是由能够实现“超长读取”的新测序技术实现的。
在先前研究的基础之上,新的研究将纳米孔测序与其他测序技术结合,并利用了光学图谱进行整合。借助这些技术,团队制造出了一个全基因组的组装,它在连续性、完整性和准确性等方面超过了之前所有人类基因组组装,甚至在某些指标上超越了当前人类参考基因组。
不过,序列上仍然存在多处缺口。为了获得完整的X染色体,团队不得不手动解决序列中的几个缺口。纳米孔的超长读取解决了两个片段的复制。
接下来,剩余的中断部位就是在着丝粒,也可以理解成染色体两条“腿”交叉的地方。这是一个出了名的难题,因为这里存在着大量重复DNA。在X染色体中,着丝粒包含的高度重复的DNA区域跨越了310万个碱基对。团队成功识别出了重复序列中的变异,将它们作为标记,用这些变异来排列长段的读取,再将它们连接在一起,从而完成了整个着丝粒区域。
下一步则是利用来自多种测序技术的数据的完善策略,从而确保序列中每个碱基的准确性。Miga解释,团队在三个不同的测序平台上使用了一种迭代过程来完善序列,并达到了高精度的水平。
染色体核型模式图显示了人类CHM13基因组的全基因组组装,它在连续性、完整性和准确性方面超过了所有先前的人类基因组组装。最右的X染色体被放大了。核型模式图旁边的蓝色和橙色长条代表没有缺口的重叠群。染色体核型模式图显示了人类CHM13基因组的全基因组组装,它在连续性、完整性和准确性方面超过了所有先前的人类基因组组装。最右的X染色体被放大了。核型模式图旁边的蓝色和橙色长条代表没有缺口的重叠群。
纳米孔测序除了能提供超长读取之外,还可以检测被甲基化修饰的碱基——这是一种“表观遗传”的变化,也就是说,它不会改变序列,但对DNA结构和基因表达有着重要影响。通过绘制X染色体上甲基化模式的图谱,研究人员能够证实之前的一些观察,并揭示着丝粒内甲基化模式的一些有趣的趋势。
新的人类基因组序列来自填补了目前人类参考基因组中的许多缺口,为基因组研究开辟了新的领域。但潜在的挑战依然存在。比如,1号染色体和9号染色体的重复DNA片段比X染色体上的要大得多。科学家接下来计划继续努力弥合更多未知的“缺口”区域。
研究人员相信,我们已经来到了“一个完整基因组序列的时代”。Miga表示:“我们开始发现,这些参考序列中存在缺口的区域,实际上是人类种群变异最为丰富的区域之一,因此,我们一直缺少许多关键信息,它们可能对理解人类生物学和疾病至关重要。”
相关文章
-
航天航空滋补研究成果权威机构-生物学大监测数据的网络时代
另一方面,积累足够多人群基因组数据库后,基因数据还可以实现帮助药企提升研发效率、进行疾病预警等功能。,BlueStar帮助病人进行自主糖尿病管理,可以提供即时血糖、血压、血脂监测,通过数据处理为医生临床决断给出建议。,其它病种,由于基因突变和疾病之间并无简单直接因果关系或具体联系尚未被知晓,基因组大数据应用的全面推广需要一定时间。
2024-03-22 08:52 -
军工滋补深入研究调查报告-生化大监测数据的当今社会
其它病种,由于基因突变和疾病之间并无简单直接因果关系或具体联系尚未被知晓,基因组大数据应用的全面推广需要一定时间。,另一方面,积累足够多人群基因组数据库后,基因数据还可以实现帮助药企提升研发效率、进行疾病预警等功能。,BlueStar帮助病人进行自主糖尿病管理,可以提供即时血糖、血压、血脂监测,通过数据处理为医生临床决断给出建议。
2024-03-22 08:50 -
追本溯源——新型冠状病毒从何而来
这就提出了这样一种可能性,即人类最初感染新型冠状病毒发生在其他地方。,1月22日,《医学病毒学杂志》在网上发表了一篇由北京大学等高校合作的基因组序列分析文章。,然而,很多专业学者对这个推断持反对意见,因为蛇是爬行动物,病毒传染给人类的可能性不高。
2024-03-22 08:48 -
未知基因组的神秘“巨型病毒”揭示病毒世界变异性
新浪科技讯北京时间2月13日消息,据国外媒体报道,目前,科学家最新发现一种具有未知基因组的神秘巨型病毒。,因为该病毒构成了变形虫的一个新谱系,其起源和种系发展令人感到费解,研究团队两个资深成员——法国马赛大学病毒学家伯纳德·拉斯科拉(BernardLaScola)和巴西米纳斯吉拉斯联邦大学的JônatasS。,研究人员指出,无论怎样,很明显自然界还有很多未解谜团需要探索发现,Yaravirus病毒
2024-03-22 08:46 -
对癌症的理解更进一步!最大规模癌症基因组研究公布
联盟报告称,平均而言,每个癌症基因组携带4-5个驱动突变,这为癌细胞提供了选择优势。,随着时间推移对同一个肿瘤的多个区域进行测序,是研究癌症演化的最有效方式;但研究人员也可以通过单次活检对演化过程进行重建——Gerstung等人5在第5篇论文中便采取了这一方法。,通过分析推断,联盟成功将十年里以观察为主的癌症测序研究向前推进了一大步。
2024-03-22 08:45 -
地球上唯一已知不会呼吸动物,长着类似外星人眼睛
新浪科技讯北京时间2月28日消息,据美国生活科学网站报道,目前,科学家首次发现地球上不需要呼吸、并且没有线粒体基因组的动物。,如果某种动物像鲑生粘孢虫一样感染鱼和水栖蠕虫的密集肌肉组织,可能也不会将氧气转化为能量。,在显微镜下观察时,这些孢子看上去就像蓝色精子细胞,有两条尾巴和一对椭圆形、类似外星人的眼睛。
2024-03-22 08:37 -
世卫组织:新冠病毒非人为操纵或实验室合成
原标题:世卫组织最新报告:目前所有已知证据表明,新冠病毒非人为操纵或由实验室合成[环球网报道记者张晓雅]世界卫生组织(WHO)官网23日发布每日新冠疫情最新报告,文中再度强调新冠病毒的起源问题。报告称,目前所有证据表明,新冠病毒源自自然界动物,并非由人为操纵或由实验室合成。报告称,2019年12月武汉报告新冠病毒感染病例后,病毒经1月初鉴定,1月11日至12日,新冠病毒全基因组序列对外公布并共享。
2024-03-22 08:09 -
今日《自然》发布迄今最大规模人类遗传变异体数据库
第二篇文章里,研究人员们侧重于对一类特别的罕见基因变异体进行临床解读。,同系列的第三篇论文探讨了如何利用人类功能丧失型变异体数据库识别候选药物靶点。,;其次,大部分基因中功能丧失型变异体十分罕见,研究人表明在推断这类变异体时会有很多误判,因此要收集到确切证据,需要比gnomAD样本量大1000倍的队列来进行验证;第三,我们虽然可以对变异体进行自动的标注,但为了去除人为引入的误差,我们依旧需要人工对
2024-03-22 07:52 -
绵羊遗传资源评价与性状遗传机制研究获重大进展
该研究成果不仅为绵羊遗传学研究提供了宝贵的基因组资源,也对今后开展分子设计育种、指导家养绵羊遗传改良具有重要指导意义。,这是实验室自2016年1月投入建设运行以来,发挥柔性引进高层次人才科研方向的引领作用,在绵羊遗传资源评价与性状遗传机制解析方面所取得的重大研究进展。,通过对所有家羊进行基于群体分化指数Fst的绵羊全基因组选择信号检测,筛选了一系列与毛细度、奶产量、窝平均产羔数和尾型等性状相关的候
2024-03-22 07:40
热门标签
-
2017淘宝爆款打造成功与否,取决于这两个核心指标!
2024-03-22 07:29
-
合伙表演砍价戏码?这样卖货对不起快手老铁!
2024-03-22 07:29
-
卖家参加618活动门槛是什么?有哪些要求?
2024-03-22 07:29
-
抖店要营业执照吗?有哪些入驻条件?
2024-03-22 07:29
-
戴尔考虑剥离VMware部门 最早明年9月前完成
2024-03-22 07:29
-
中概股回归潮起 资本市场拥抱新经济正当时
2024-03-22 07:29
-
卖家怎么设置618跨店优惠券?怎么设置活动?
2024-03-22 07:29
-
淘宝转换率有什么用?影响淘宝转换率的因素有哪些?
2024-03-22 07:29
-
你的手机正在泄露你的隐私 下架整改难遏“窥私”冲动
2024-03-22 07:29
-
淘宝618退货订金退吗?规则是什么?
2024-03-22 07:29
-
淘宝小店功能在哪里?如何使用?
2024-03-22 07:29
-
三峡大坝变形了吗?会溃坝吗?
2024-03-22 07:29
-
微信小商店来了 有赞微盟们会被抢饭碗吗?
2024-03-22 07:29
-
61有优惠618还会更优惠吗?做好哪些准备?
2024-03-22 07:29
-
淘宝差评处理技巧:如何从源头上有效规避差评?
2024-03-22 07:29
-
传原阿里全球电竞负责人加入字节跳动,或为布局国际电竞业务
2024-03-22 07:29
-
抖店服务分怎么提高?有哪些技巧?
2024-03-22 07:29
-
2021天猫618是提前了吗?提前了多久?
2024-03-22 07:29
-
618从哪天从开始?活动有几天?
2024-03-22 07:29
-
2017淘宝数据分析软件有哪些?淘宝数据分析软件哪个好?
2024-03-22 07:29