来源:知识分子
撰文|吴蕾
责编|陈晓雪
pixabay.compixabay.com
2020年4月8日,一篇新冠病毒(SARS-CoV-2)群体遗传学的论文在《美国科学院院刊》(PNAS)上线[1],来自德国法医遗传学研究所等单位的PeterForster等人对病毒基因组序列进行了进化分析,结果显示以东亚地区病毒为主体的病毒类群并不是最古老的。有媒体将其解读为新冠病毒起源于美国和澳大利亚。这里,本文尝试从学术角度探讨该论文的数据代表性和分析方法可能存在的问题。
1
Forster等的主要证据
在该论文唯一的一幅图里,Forster等人展示了新冠病毒的单倍型网络(haplotypenetwork)。他们将新冠病毒分为A、B、C三个类群(由红圈标记的字母所示),发现东亚地区的病毒样本大多在B类群,而欧美和澳大利亚则多为A类群。他们将蝙蝠携带的冠状病毒序列(RaTG13)[2]同样置于该单倍型网络,并与这三个类群的新冠病毒进行比较,发现A类群在序列上距离RaTG13最近。科学界普遍接受蝙蝠是冠状病毒的自然宿主之一,因此作者认为A类群的新冠病毒更为古老。
单倍型网络分析是一种基于基因序列推测进化关系的方法。本图中,每个节点为一种病毒序列,节点越大说明该病毒序列在已测序的样本中数目越多,节点内部的饼图则反映样本的国家或地区来源比例;节点之间的连线长度则反映了从一条序列进化为另一条序列所需要的突变数目。
2
原文分析病毒样本数目过小
Forster等人将全球各地的新冠病毒分为了三个类群。这个分类合适吗?
在回答这一问题之前,不妨先了解一下中科院北京基因组所国家基因组科学数据中心绘制的单倍型网络。该中心提供的最新数据[3]如下图所示。
来自于国家基因组科学数据中心,图的下方展示了病毒样品的采集时间。录制于2020年4月11日。
来自于国家基因组科学数据中心的单倍型网络翔实程度远胜于Forster等人的文章,更重要的是该网络可以按照样品的采集时间展示单倍型网络模式经历的剧烈变化。目前的单倍型网络与Forster等人文章中的截然不同。这并不意外,因为Forster等人的文章上线之时(2020年4月8日),GISAID数据库的新冠病毒基因组序列有大约4800条[4],而Forster等人只分析了其中早期的160条(约3%)[1]。即使时间前推至该文章送审的3月17日,当时GISAID数据库的序列也已超过了800条(Forster等分析了其中不到20%);更何况在文章修回和正式上线之前,作者始终都有机会更新数据。
那么,160个早期的病毒样品是否已经有了足够的代表性追溯病毒的起源了呢?如果我们相信早期的病毒样品都采集齐全时确实可以。然而,我们今天仍然存在着对病毒更古老类群的讨论,恰恰是因为担心早期的样本没有采集齐全。
3
RaTG13无法帮助确定哪个新冠病毒更古老
即便假设Forster等人的文章将新冠病毒划分为A、B、C三个类群是站得住脚的,那么,主要流行于欧美和澳大利亚地区的A类群病毒是否更为古老?Forster等人给出了肯定的答案,他们的依据是在单倍型网络中A类群更靠近蝙蝠来源的病毒序列RaTG13。
事实上,RaTG13并不能对新冠病毒内部的进化关系进行区分。
为什么这么说?
RaTG13确实是目前已知进化上距离新冠最近的病毒,然而其与新冠病毒的基因组差异仍然达到约4%——这比人和黑猩猩DNA序列的差异还要大。4%大致对应于RaTG13与新冠病毒1200个碱基的差异,而目前已测序的大多数新冠病毒之间的差异不足10个碱基。根据新冠病毒每年约24个碱基的变化[5]来推断,RaTG13大致在25年前就已经与新冠病毒分道扬镳了。这对于新冠这样一个迅速繁殖的病毒来说,是一个极其“漫长”的进化过程。
值得注意的是,在Forster等的文章配图中,不知出于什么考虑将RaTG13置于与A类群仅相差17个突变的位置。这可能会让读者产生RaTG13的序列与新冠病毒差异不大的错觉。
也许有人会认为,图中少画一些差异碱基,并不影响得出“A类群距离蝙蝠来源病毒更近”的结论。这听上去好像也有些道理,但实际情况却并非如此简单。
想象一下你站在一条笔直的马路上,身边有两个电线杆。从现在的视角看来,两个电线杆界限分明;但随着你沿马路越走越远,再回望时会发现两个电线杆在你的视野中越靠越近;当你走出肉眼分辨率的极限之后,两个电线杆在你眼中成了同一片模糊的区域——因此,如果要对事物进行区分,需要选择合适的观测尺度。
使用RaTG13判断目前已采集的这几千个新冠病毒谁更古老,恰恰就是超出了合适的尺度。具体而言,在下面的这个进化树中,每条黑线的末端都是一个病毒样品,样品的名称标记在了黑线的延长线上(字很小,但不是线,线都在圆心位置附近),黑线的长度则反映了基因组序列的差异程度。出现在进化树底部的是RaTG13;其他的是新冠病毒,它们由于序列过于相近而聚集在一起。可以看出,蝙蝠来源的序列与新冠病毒的差异实在太远,以至于“站在”RaTG13的位置已经无法对新冠病毒内部的进化关系进行区分。
扩展阅读
在较小的进化尺度上,突变是偶然事件,两个病毒共享一个突变往往意味着它们拥有共同的祖先或者“亲缘”关系更近——这也是进化树构建的基本原理。但是基因组中存在一些特别容易出现突变的区域,称为突变热点(mutationhotspot)。一旦超出了一定的进化尺度,在亲缘关系较远的个体中,突变热点就有可能独立产生出现同样的突变(被称为反复突变,recurrentmutation)。然而,在对基因组序列进行进化分析的时候,我们不知道序列的相似性究竟来源于共同祖先还是反复突变,仍然会按照它们拥有共同祖先推断亲缘关系,这就会产生错误。
在分子进化领域有一个专业词汇“长枝吸引效应”(longbranchattraction),就是描述这种由于进化距离过于遥远导致错误推断进化关系的情况。由于长枝吸引效应的存在,用于构建进化树的序列不应在进化距离上存在巨大的差异(都长也可以,都短也可以,但是不能长短不一),否则可能严重影响其可信度。
Forster等人使用RaTG13作为“外群”的研究中,就很可能受到反复突变的影响,原因是新冠这个RNA病毒确实存在突变热点:如下图所示,在Forster等的文章配图中多次出现四个点四个边连接的封闭四边形,这就是在过去几个月中同一突变独立发生于不同病毒个体上的证据。这种多次独立发生的同一突变在更大的尺度上就会对进化关系的推断造成干扰,甚至导致错误。
4
文章毕竟通过了同行评议并发表在了主流期刊上?
无可否认,PNAS是学术界的主流期刊,因此文章能够发表在该刊物常常也可以为其学术的严谨性背书。然而,PNAS的审稿机制存在一些与众不同的地方。
正如该期刊名称《美国科学院院刊》所反映的,PNAS在1914年创建之初就是作为美国科学院院士的出版场所而存在的——院士署名贡献的文章(contributed)或者院士出面“沟通”(communicated)的文章才能得以发表。直到1995年,PNAS才开始试行普通作者的直接提交(directsubmission)。院士出面沟通的论文发表方式至2010年中止,但是院士目前仍然可以以通讯作者(或共同通讯作者)的身份向PNAS提交论文,并指定至少两位学者作为公开的评阅人(也就是说评阅人名字会在发表的文章中公布)。PNAS大约25%的文章属于这一类别[6]。如下图所示,Forster等人的文章就是这其中之一。
ColinRenfrew为英国剑桥大学的考古学家,也是美国科学院外籍院士。
PNAS这一制度当然有其积极的意义:如果一篇文章由于超前于时代难以通过正常的同行评议发表,这一机制将是让该学术思想获得广泛传播的一种途径。但同时也存在一些隐患,可能让本来不够严谨的研究得以迅速发表。
在制度上,PNAS要求贡献文章的院士需是该文章所在领域的专家[6]。然而,贡献Forster等人这篇文章的美国科学院外籍院士ColinRenfrew是英国考古学家和古生物学家,以放射性碳定年、史前语言和防止考古现场的掠夺性挖掘方面的工作而闻名[7]。
5
文章上线后同行评论以负面为主
Forster等人文章上线后受到了同行的普遍质疑。英国爱丁堡大学的AndrewRambaut是分子进化方法学以及病毒进化领域的国际知名专家(Hindex高达115——有115篇论文被引用了至少115次)。他评论到:“这篇文章存在很多严重的错误,包括它的内容、结果和发表的途径。”
他指出,“第一个错误在于使用蝙蝠冠状病毒RaTG13对新冠病毒的进化树进行定根。这虽然是最接近新冠病毒的‘非人类’病毒,但与新冠病毒仍然有1100个核苷酸以上的差异。注意,(Forster等人文章的图中)蝙蝠病毒所在的进化枝不知为何比实际要短一些。”
新冠病毒进化的权威网站Nextstrain[5]负责人TrevorBedford同样对文章表达不满:“这不是一篇好文章,没有比几周前就已经有人完成了的工作多出什么内容。A、B、C类群的划分不但太简化、有误导性,而且也是错的……”
写在最后
如果蝙蝠冠状病毒RaTG13不能用于确定病毒的祖先,那还有什么其他办法吗?
首先,如果我们能找到新冠病毒的中间宿主并分离出其携带的冠状病毒,将有很大机会通过进化遗传学方法判断新冠病毒的祖先。其次,截至2020年4月12日23点,已有6365条新冠序列提交到GISAID数据库[4]。这些序列可以用于根据进化的分子钟推测病毒在人群中开始扩散的时间,原理详见《赛先生:缺乏早期样品,还能追溯回病原体扩散的第一天吗?》。第三,对于新冠病毒,旅行记录在一定程度上也可以为单倍型网络的连线赋予进化方向,辅助祖先的推测。
需要说明的是,病毒起源的定义在不同的语境下常常极其模糊。病毒像其他生物一样,在随机突变的不断积累中进化。如果一个病毒原本就在人群中存在一定程度的传播,在某一时刻突变获得了迅速扩散的能力并导致了肺炎的症状,那么这个病毒开始感染人类的时间和地点与在人群中暴发的时间和地点就并不相同。在这种情况下,病毒究竟应该算起源于何时何地呢?
在这个意义上,新冠病毒的恐怖之处不止于对人类身体的摧残,更在于其对精神的割裂。武汉同胞即使已经为战胜疫情做出了巨大的牺牲,但在很多地方仍然遭受区别对待;国家、地区或人群的名字依然被用作病毒的定语。我们反对“中国病毒”的称呼,同时,我们也需要反思并纠正其他将地名与病原菌或疾病相联系的命名,例如“西班牙流感”、“埃博拉病毒”、“寨卡病毒”、“中东呼吸综合征”……
相关文章
-
新冠可怕后遗症出现了,张文宏凌晨发文:真相远不止这些
与此同时,研究还发现:一些新冠患者还会出现包括注意力、专注力、信息处理速度下降和记忆力受损等情况。,被治愈后,戈贝尔在接受家乡媒体法国《队报》的采访时谈到了:“嗅觉还没有100%恢复。,”对于未来抗疫,我们应该有很清晰的思路,而不是整天在争论是清零还是共存。
2024-03-22 22:02 -
病毒伪装成微信扣手机费 女子200元被吸光
”市民郭女士拨打早报热线82888000反映说,她更新了杀毒软件进行查杀,发现之前安装的“天天酷跑”竟然是病毒。,安装后,后台会启动服务,未经允许私自发送大量扣费短信;该病毒还能够在后台屏蔽相关回执短信,使得用户在毫不知情的情况下订购了大量扣费业务,造成了资费消耗。,对此,百度手机卫士安全专家提醒手机用户,下载手机软件时一定要到官方网站或正规站点,或者使用各类主流的安卓应用市场直接下载;另外,注意
2024-03-22 21:05 -
病毒模式引流淘宝客是什么样子的?
病毒模式引流淘宝客大家了解吗?病毒营销除了在微信、QQ上的营销之外,还有没有别的平台呢?答案当然是肯定的,前面跟大家说了怎么看淘宝客引流,下面就和大家来分享一下病毒营销在淘宝客中的应用。,举一个简单的例子,比如,推出一套有价值教程,如果您想要学习,需要推广100个ip到该教程的广告页面,或者您想要免费获取某个软件,就需要将指定链接发送至100个群,凭借截图免费获取。,最后,我们来说说成功的病毒式流
2024-03-22 12:53 -
勒索软件“变形术”升级 大规模垃圾邮件瞄准银行
2019年第3季度勒索软件检测类型TOP10第三季度报告与第二季度存在类似的一些状况,本季度勒索软件感染的高发地是巴西、中国与印度,高发行业则是制造业、保险这两个行业,这些地区与行业的共同点在于,其网络安全防护能力都相对薄弱,而且终端设备数量庞大,更容易被勒索软件找到可乘之机。,挖矿病毒运行后,进程会占满CPU资源,导致电脑卡顿,给业务带来巨大影响。,随着近期“区块链”再次变成热门话题,挖矿病毒很
2024-03-22 09:16 -
满足这4个条件,疾病就可以被永久消灭?
虽然我们仍然不清楚原因,但这些特征让人们更容易追踪新的天花感染,并且能迅速阻止疫情暴发。,麦地那龙线虫是一种在生物学上与天花病毒具有很大差异的病原体,这也使它很难被消除。,但在过去五年,医生发现麦地那龙线虫还能感染除人之外的其他动物,因此消除这种寄生虫变得越来越困难。
2024-03-22 09:10 -
他们分析41个肺炎病例,发了一篇《柳叶刀》论文
而ICU患者在入院时D-二聚体水平和凝血酶原时间偏高(凝血酶原中位时间12.2s,中位D-二聚体水平为2.4mg/L),这或许能够帮助临床医生预测入院患者的病情进展。,抗病毒治疗:1月23日,之前被确诊感染新型冠状病毒的北京大学第一医院呼吸和危重症医学科主任王广发接受媒体采访时表示,艾滋病治疗药物洛匹那韦/利托那韦片对他有效,服用后只用了一天体温就好转。,网络上总有人说:“这次疫情赶上了春运,一定
2024-03-22 08:50 -
9名患者基因序列分析再次指向新冠病毒起源于蝙蝠
与杭州舟山市蝙蝠上采集到的病毒基因序列相似最高那么,2019-nCoV病毒到底从何而来?,研究者们给出了四个理由:第一,疫情于2019年12月下旬首次报告,当时武汉多数蝙蝠物种正在冬眠。,第二,华南海鲜市场没有出售或发现蝙蝠,而各种非水生动物(包括哺乳动物)可供购买。
2024-03-22 08:50 -
疫情之下,国内外社交平台如何精准辟谣?
从1月6日国家疾控中心内部发文,启动二级应急响应开始,有关此次肺炎的新闻和谣言开始齐飞,从喝高度酒能抵抗新型冠状病毒,到双黄连可以预防新型冠状病毒等,其中不少谣言不乏有权威媒体的背书。,未来几周内,Facebook还会与更多合作伙伴获得数据联系,比如通过CrowdTangle之类的工具帮助用户了解如何在线讨论问题,从而更好地告知信息。,目前此项活动已经在澳大利亚,巴西,加拿大,香港,日本,马来西亚
2024-03-22 08:50 -
门把手发现病毒?专家:别怕 只是病毒"碎裂了的尸体"
(七)若有发热、咳嗽等呼吸道症状,有且有类似病人近距离接触过,请戴上一次性医用口罩及时到医院就诊。,(三)日常家居类消毒剂按产品标签标识以杀灭肠道致病菌的浓度进行配制和使用。,因此,我们仍需要呼吁,请大家一定要经常清洁双手,在未洗手前不要触摸自己的口鼻和眼睛。
2024-03-22 08:50 -
检测“战疫”:11家创新公司在行动 背后都有VC/PE
近日,中国证券投资基金业协会发布报告显示,疫情发生以来,私募股权和创投基金管理人不仅捐款捐物,更是发挥基金作为投资方的影响力,在病毒检测制剂和系统研发生产领域,与投资企业一道快速反应,第一时间投入,共同挺身而出。,北极光创投投资企业卡尤迪紧急研发的新型冠状病毒(2019-nCoV)免核酸提取RNA检测试剂盒获得权威机构验证,实现对新型冠状病毒在1分钟内加样快速筛查,由企业捐赠的仪器和试剂已由军科院
2024-03-22 08:49
热门标签
-
马斯克:无人出租车计划仍在进行中 待监管部门批准
2024-03-22 08:15
-
怎么淘宝开店卖东西?需要做好哪些方面?
2024-03-22 08:15
-
淘宝双11天天领红包在哪里?有哪些红包类型?
2024-03-22 08:15
-
淘宝标题seo咋做推广?淘宝标题怎么优化才能有排名?
2024-03-22 08:15
-
淘宝嘉年华海选通过了有什么用?报名后是否可以撤销?
2024-03-22 08:15
-
wish商户手机号能改吗
2024-03-22 08:15
-
为什么诈骗损失难以追回
2024-03-22 08:15
-
天猫双11尾款什么时候付?有什么规则?
2024-03-22 08:15
-
站点关键字科学合理常识-站点页面规划方案
2024-03-22 08:15
-
淘宝标题seo咋做?seo标题关键词怎么写?
2024-03-22 08:15
-
新人直播不冷场的技巧是什么?分享几个小技巧
2024-03-22 08:15
-
讲解外链页面科学合理预处理常识
2024-03-22 08:15
-
2020年双11海选报名入口在哪?要求有哪些?
2024-03-22 08:15
-
【女生怎么做长尾改进】seo页面发表和选取关键性名词的六大诀窍!
2024-03-22 08:15
-
淘宝标题seo优化是什么?seo的优化技巧和方法
2024-03-22 08:15
-
2020年双11海选什么时候开始?怎么报名?
2024-03-22 08:15
-
「首页改进窍门」首页简化有哪些窍门!
2024-03-22 08:15
-
网页页面改进的几类要点
2024-03-22 08:15
-
2020年淘宝99划算节跨店满减如何设置?设置条件是什么?
2024-03-22 08:15
-
淘宝标题的字数限制为多少个汉字?展现量高点击率低什么原因?
2024-03-22 08:15