首页 电商 正文

AI可以如何抗击新冠?WHO论文称这三大场景大有可为

2024-03-22 08:24
admin

欢迎关注“创事记”微信订阅号:sinachuangshiji

选自arXiv

作者/JosephBullock等机器之心编译

来源:机器之心(ID:almosthuman2014)

随着新冠疫情的持续发展,全世界的研究者都在致力于疫情的缓解,其研究重点包括:追踪病毒传播、促进病毒检测、开发疫苗、寻找新的治疗方法、了解疫情的社会经济影响等。在这篇综述文章中,来自杜伦大学、蒙特利尔大学、WHO等机构的研究者探讨了AI相关技术在疫情中发挥的作用,总结出了AI在医疗、分子、社会三个层面的应用。

具体来说,分子层面包括药物挖掘等相关研究;医疗层面包括个体病人的诊断和治疗;社会层面包括流行病学和信息医学研究等。此外,论文还综述了当前可用的开源数据集和其他资源。

这篇综述的目的并非评估文中所述技术的重要性,也不做推荐之用,而是向读者展示当前AI技术在抗击疫情方面的应用范围。

论文链接:https://drive.google.com/file/d/1vDcb6HeS-hufNgqH0dDhIEGjuJpnnkzT/view

医疗层面:从诊断到结果预测

迄今为止,AI在应对COVID-19上的应用大多集中在医学成像的诊断上。在近期多篇文献中,除了使用患者医学数据预测疾病进展的方法、用于病情监测的无创检测方法,还有AI协助计算机进行CT诊断的案例。

医学影像诊断

RT-PCR测试是诊断COVID-19的关键方法,但这种方法仍存在样本采集、分析时间等局限性,所以人们越来越关注使用医学成像技术进行COVID-19诊断。COVID-19具有特殊的放射学特征和图像模式,这些特征均可通过CT扫描的方式观察到,但对于放射学科的医务人员来说,识别这些图像也颇为费时,因此在CT扫描诊断过程中使用机器学习方法是一种理想的选择。

多项研究已经将诊断定为二元分类问题,即“健康”与“新冠病毒阳性”。

Wang等人使用改进过的Inception神经网络架构,对医生确定过的区域进行训练,从而对健康患者和新冠患者进行二元分类。基于259位患者的约1000个图像切片的数据集,研究者训练出了能够识别疑似COVID-19的模型,然后将结果提供给医生作进一步诊断。

Chen等人也发现,在经由专业医生标记过的6000多张CT图像切片数据上训练UNet++神经网络,其性能可接近专业医生的诊断水平。这一模型之后在武汉大学人民医院进行部署,用以协助医生加快对病例的分析及诊断,目前这一模型也已开源。

其他机器学习方法将诊断归结为3种分类任务:健康、COVID-19患者及其他类型肺炎患者。

在Xu和Song的研究中,经典的ResNet架构可用于特征提取。Xu等人添加了几个用于分类的全连接层,Song等人则添加了特征金字塔网络(FeaturePyramidNetwork)和注意力模块,使网络更加复杂,但在图像细粒度方面表现更好。

这两项研究均表明,即使在诊断过程中可能存在多个疑似结果(包括非COVID-19的肺炎类型),这种方法也能够准确地区分开来。

此外,还有一些研究采用了融合型方法:将现有的软件与特定机器学习方法相结合,以实现更高的准确性。

在Gozes等人的研究中,商业医学影像程序可用来进行原始图像的处理,然后与一个MLPipeline结合使用。这种两步式方法包含在肺异常医学影像数据上训练过的U-Net架构,以及在ImagetNet上训练过的Resnet-50,其中图像分类已微调为“Coronavirus”和“健康”。

Shan等人的研究中,采用了“human-in-the-loop”的方法减少机器学习架构所需的标记时间。研究者使用少量人工标记的数据来训练基于V-Net架构的初始模型。

该模型对新的CT扫描影像进行分割,之后经由专业医生校正,在迭代过程中不断反馈到模型中。这种方法使得基于深度学习技术的系统可用于自动分割和感染区域统计,以及评估患者COVID-19病情的严重程度。

研究表明,该模型的性能逐步提升,经过200个带注释的示例数据训练之后,将新图像分析所需的人工时间从开始的30分钟以上减少到5分钟以上。这个方法将机器学习的优势与人类的专业知识相结合,是一个前途广阔的研究方向。

疾病跟踪的非侵入式测量

另外一种不需要特殊医疗成像设备的原创性方法是,通过Kinect深度相机来识别病人的呼吸模式。

该方法基于最近对COVID-19患者症状的临床发现,即COVID-19患者的呼吸模式不同于其他流感或普通感冒,其较明显地表现出呼吸急促症状。

基于以上临床信息,研究者开发出一种具有注意力机制的双向GRU神经网络,并使用它来识别反常的呼吸模式。

研究者使用20名参与者的真实数据以及基于真实记录产生的大量仿真数据来训练该模型。虽然这些反常的呼吸模式并不一定与真实的COVID-19诊断相关,但对这些呼吸急促症状的预测可作为首要诊断特征,为大范围监控潜在患者提供帮助。

另外一些方案是使用手机来检测COVID-19,有使用嵌入式传感器来识别COVID-19症状的,也有通过回答在手机调查问卷中的一些关键问题来排查高风险病人的。虽然以上方法都是在移动技术方面的重要尝试,但目前的研究并不足以评估这些方法的可行性与性能表现。

患者预测

Yan等人提出一种基于患者临床数据与血样检测中特征的预测方法,该方法能够帮助临床医生尽早地识别出高风险患者,希望以此提高患者的预后以及减少重症患者的死亡率。

与此研究相类似的方法有,基于XGBoost算法的预测模型,其用于预测死亡风险和识别能够在医院中进行检测的关键测量特征。基于375名患者的数据,作者从300多个输入特征中筛选出三个关键临床指标,为预测患者死亡率提供了一种临床启发式的依据。该方法的一大优势是其具有良好的可解释性,因为筛选出的这三个指标与COVID-19病理学进展中的几个最重要因素相关,即细胞损伤、细胞免疫与发炎。

一个与此互补的研究是,在半自动标记的CT影像上训练一个U-Net变种,该方法旨在预测COVID-19患者是否需要长时间住院观察。这意味着一旦完成初期诊断,我们仍然可使用机器学习的方法来预测患者病情的严重程度以及是否需要长期住院。

分子层面:从蛋白质到药物挖掘

蛋白质结构预测

蛋白质具有的3D结构由它们的基因序列决定,并且该结构会影响蛋白质的功能与作用。一般而言,蛋白质结构通过X光晶体衍射图谱法等实验研究法来确定,但这些方法花费昂贵、耗费时间。

最近,计算模型已经被用来进行蛋白质结构的预测,主要有两种方式:一种是模板建模,它的原理是利用相似蛋白作为模板序列进而预测蛋白质结构;另一种是无模板建模,它主要预测那些无已知相似结构的蛋白质的结构。

2018年底,谷歌DeepMind重磅推出AlphaFold,它能够利用基因序列预测蛋白质结构。给定一种新的蛋白质,AlphaFold利用神经网络来预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。根据神经网络预测的两种物理属性,DeepMind还训练了一个神经网络以预测蛋白质成对残基(residues)之间距离的独立分布,这些概率能组合成估计蛋白质结构准确率的评分。目前,AlphaFold可以预测与SARS-Cov-2相关的6种蛋白质的结构,分别为SARS-Cov-2膜蛋白、蛋白3a、Nsp2、Nsp4、Nsp6和papain-like蛋白酶。

改进病毒DNA测试

当前,机器学习和新型基因组技术也用来提升PT-PCR的测试效果。Metsky等人利用CRISPR(一种通过割裂特定基因遗传代码链并利用酶来编辑基因组的工具)来进行检验分析设计,用以检测包括SARS-CoV-2在内的67种呼吸道病毒。此外,对于那些被预测为敏感性和特异性并且涵盖多种基因组的检测分析,有些ML模型可以加速它们的设计。

老药新用

发现当前药物可以用来治疗COVID-19的一种方法是生物医学知识图谱。生物医学知识图谱网络可以捕捉蛋白质与药物等不同实体之间的联系,从而可以进一步了解它们彼此之间的关联。

Richardson等人利用生物医学知识图谱识别出了巴瑞替尼,这是一种通常用于治疗关节炎的药物,但由于它能够抑制AP2相关的蛋白激酶1(AAK1),使得病毒很难进入宿主细胞,所以该药物可能适用于COVID-19的治疗。

Ge等人也提出一种类似方法来构建关联人体蛋白、病毒蛋白和药物的知识图谱,它所使用的数据集捕捉了这些实体之间的关系。这种知识图谱用来预测可能有效的候选药物。作者已经识别出了多聚腺苷酸聚合酶抑制剂CVL218,目前正处在临床试验阶段。

其他一些研究也利用创建的模型来预测蛋白配体的复合物亲和性,以解决老药新用的难题。Hu等人使用多任务神经网络对亲和性进行广义预测。作者已经识别出了一系列SARS-Cov-2相关的蛋白质,如RNA依赖的核糖核酸聚合酶、3C-like蛋白酶、解旋酶以及包膜蛋白等等,从而借助于4895种药物的数据集展开靶向治疗。他们推荐了10种可能有效果的药物以及这些药物的靶蛋白和复合物亲和性评分。为了提升模型的可解释性,他们还对每个靶蛋白可能出现结合的精确位置进行预测。

同样地,Beck等人利用他们提出的MoleculeTransformer-DrugTargetInteraction(MT-DTI)复合物亲和性模型,识别出美国食品及药物管理局(FDA)批准抗病毒药物中可能对6种冠状病毒蛋白质(分别为3C-like蛋白酶、RNA依赖的核糖核酸聚合酶、解旋酶、3』-to-5』核酸外切酶、endoRNAse和2』-O-ribose甲基转移酶)有效的药物。MT-DTI模型以SMILES数据和氨基酸序列的形式输入串数据,并运用一种借鉴BERT算法的文本建模方法。此外,该模型识别的药物可能对上述蛋白具有靶向效果。

最后,Zhang等人利用密集全连接神经网络,它在PDBBind数据集上被训练用于预测复合物亲和性,从而识别3C-like蛋白酶的潜在抑制剂。他们利用SARS病毒变体创建了靶蛋白同源(模板)模型,并探索现有复合物(如ChemDiv和TargetMol)和三肽的数据集,从而找出对蛋白质具有靶向效果的治疗手段。

药物发现

一些研究者试图寻找新的化合物,用来治疗新冠肺炎。Zhavoronkovetal.(2020a)等就使用了一个专有管道,寻找类3C的水解酶抑制剂。他们的模型使用了三种输入:蛋白质晶体结构、类晶体的例子,以及蛋白质模型本身。对于每个输入类型,研究者拟合了28种不同的模型,包括生成自编码器和生成对抗网络。研究者使用强化学习探索潜在的候选药物,其中有一个奖励函数和一些标准——药物相似性、新颖性、和多样性相联系。同时,他们确认识别出的候选化合物和已有的化合物不同,说明它们确实找到了不同的药物。

Tangetal.(2020)也使用了强化学习来发现药物。研究者整理了284种已知的分子——能够抑制SARS类病毒。他们将这些蛋白质打碎成316个片段,然后使用高级深度Q-learning来组合,进行药物设计。这种强化学习的奖励函数有三个评价角度:药物相似性分数、加入的预定义“倾向使用的”片段和出现的已知药效集团(和化合物的功效有关的特定结构)。

结果,有4922个结果通过启发式搜索被过滤。最终有排名最前的47个化合物在分子模拟中进行评估。研究者会选择最可能有效的化合物,并进行生产和测试。

社会层面:流行病学和信息病学

流行病学

流行病学研究覆盖领域极其广泛,其流行的规模和相关性,以及数据的实时更新等多方面因素导致了研究工作必须进行多种类建模。但此次团队将专注于用机器学习去完成流行病学建模的案例。

鉴于流行病感染速度迅速,所以短期实时预测是作为提供信息的重要来源之一,同时模型必须兼备灵活性,以适应各种不断变化的协议或是程序。

Huetal.(2020b)†收集了WHO以及其他预测参与者于2020年1月11日至2月27日期间收集的数据,用以开发创建一个新的关于中国国内累积或是新增确诊病例的数据集。这些信息主要用于训练调整后的自动编码器(MAE),以便实时预测新病例,并估计流行病的严重程度以及持续时间。

类似的,Al-qanessetal.(2020)模型可以使用历史数据并提前十天预测确诊病例的总人数。而作者的模型是基于neuro-fuzzyinferencesystem(ANFIS)(Jang,1993),flowerpollinationalgorithm(FPA)(Yang,2012)以及salpswarmalgorithm(SSA)(Mirjalilietal.,2017)进而最优化模型里的参数。

而Mizumotoetal.(2020)通过ML的方法利用从钻石公主号游轮上所收集的感染数据来了解无症状病例的发生率。作者利用这些数据通过贝叶斯分析对时间序列进行建模,并使用了HamiltonianMonteCarlo(HMC)以及No-U-Turn-Sampler(Homan&Gelman,2014)进行调整模型参数,从而预估无症状感染者的可能性。尽管在这种封闭式环境中进行分析是非常重要的,但是否值得对外适用于更广泛的人群还有待观察。

信息学

当下社交媒体以及在线平台已成为疫情相关信息的主要传播渠道,而团队更看重的是“信息流行病”,如错误信息的信息或是谣言会越传越广。

Cinellietal.(2020)†分析了与COVID-19相关社交媒体的内容,作者从Twitter,Instagram,YouTube,Reddit,以及Gab中收集的800万条于2020年1月1日至2月14日间使用COVID-19关键字的评论或帖子。作者预估了对COVID-19话题的参与度,并横向比较了各平台间话题的发展进度。互动参与度是通过使用累积的贴子数以及45天内对帖子的反馈来反应的(如评论,点赞等)。作者采用phenomenological(Fismanetal.,2013)以及经典SIR模型来表示信息传播或复制的数量。

类似的,Mejova&Kalimeri(2020)†研究对象是使用带有病毒相关内容的Facebook广告,通过使用“冠状病毒”以及“COVID-19”等关键字去搜索所有广告,其范围覆盖了34个国家及地区,并收集了923余条结果。大部分位于美国和欧盟,而其中5%的广告是具有较强的误导信息。

此外,也有研究者着手于新冠病毒特定新闻内容的整理,并进行了人工和自动的真实性验证和相关性分析。Pandeyetal.(2020)†开发了一个评估每日新闻头条和WHO建议之间相似度的渠道。如果相似度高于某个阈值,则这篇新文章就会在用户的时间线上出现,同时附有WHO的相关建议。其中相似度的阈值由人工审核确定,依据用户反馈不断更新。针对相互矛盾的信息,这种方法可以帮助大众识别准确可信赖的新闻报道,也能促使重要的指导性文章产生更广泛的影像,推动官方的关注与采纳建议。

数据集和其他资源

利用AI抗击新冠病毒离不开各种开源数据集和其他资源,本文重点介绍了当前可用的案例数据、文本数据和生物医学数据。

案例数据

案例数据是指病例的数量和地域分布,这种数据对于追踪COVID19疫情的蔓延具有重要作用。这份综述列举的案例数据包括:

WHOCOVID-2019现状报告:https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports

约翰·霍普金斯CSSE:https://github.com/CSSEGISandData/COVID-19

nCoV2019GitHub项目:https://github.com/beoutbreakprepared/nCoV2019

人道主义社会交换项目:https://data.humdata.org/event/covid-19

专为医学专家开发的项目:https://github.com/CodeForPhilly/chime

意大利封锁后的移动变化数据:https://covid19mm.github.io/in-progress/2020/03/13/first-report-assessment.html

文本数据

NLP方法在这次疫情研究中发挥了重要作用,利用该技术解读的大量文本信息可以帮助我们了解当前有哪些信息是已知的(如病毒传播、环境稳定性、风险因素等)。这部分的数据包括:

WHO全球新冠病毒研究文献数据库:https://www.who.int/emergencies/diseases/novel-coronavirus-2019/global-research-on-novel-coronavirus-2019-ncov

当前最大的新冠相关文献开源数据集CORD-19:https://pages.semanticscholar.org/coronavirus-research

Kaggle开源数据集挑战赛:https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

其他开源数据集:https://www.ncbi.nlm.nih.gov/research/coronavirus/;https://covid-19.dimensions.ai/

社交媒体数据集:https://github.com/echen102/COVID-19-TweetIDs;https://www.kaggle.com/smid80/coronavirus-covid19-tweets

生物医学数据

目前,用于诊断的开源数据集和模型还不是很多。上文中提到的一些CT扫描方法可以找到,但用于训练系统的方法并没有系统地开源。目前,这一方向的努力包括:

CovidChestX-RayDataset:https://github.com/ieee8023/covid-chestxray-dataset

DataAgainstCovid-19:https://www.data-against-covid.org/

在基因组测序和药物挖掘方面,有几个数据集是基于之前存在的计划或专门为COVID-19从零开始创建的。这方面值得关注的项目包括:

GISAIDInitiative:https://www.gisaid.org/epiflu-applications/next-hcov-19-app/

RCSB蛋白质数据库:http://www.rcsb.org/news?year=2020&article=5e3c4bcba5007a04a313edcc

药物挖掘信息共享网站:https://ghddi-ailab.github.io/Targeting2019-nCoV/

跟踪新冠病毒遗传多样性的Nextstrain:https://nextstrain.org/

蛋白质折叠游戏Foldit:https://fold.it/

在文章的最后,研究者呼吁社区展开更多的跨学科合作和数据共享,通过国际社区的力量共同对抗疫情。

相关文章

  • 618京东能打折多少?活动节奏是什么?

    618京东能打折多少?活动节奏是什么? 在京东618活动中,有很多优惠给到各位买家,其中就包括了一些优惠券,京东红包和满减优惠,虽然看起来优惠多多,诚意满满,但是具体商品能打个几折呢?相信很多人都有这个疑问,下面就来介绍下。618京东能打折多少?1、图书400-300(每满199-100叠加199-100元图书神券)2、办公文具400-300(每满199-100叠加199-100元文具神券)3、生鲜199-1004、日百199-1005

    2024-03-13 19:04
  • 京东618会有优惠吗?活动力度大吗?

    京东618会有优惠吗?活动力度大吗? 京东618 每年6月是京东的店庆月,每年6月18日是京东店的庆日。在这个月里面,都会推出一系列的大型促销活动。那么,京东618是真的会有优惠码?活动的力度会很大吗?下面和大家分享一下。京东618会有优惠吗?1、图书400-300(每满199-100叠加199-100元图书神券)2、办公文具400-300(每满199-100叠加199-100元文具神券)3、生鲜199-1004、日百199-10

    2024-03-13 18:24
  • 2022年618活动满减,节奏是怎样的?

    2022年618活动满减,节奏是怎样的? 现在说到618活动,有一些商家有操作京东店铺的经验,但是现在京东平台是在变化的,店铺每天也是在变化的。那么,2022年京东平台618的满减活动是怎么样的?活动的节奏有是怎样的?一、2022年618活动满减按照活动的规则,在618期间有跨店满减,今年的满减门槛是每满200减30,就可以享受满减的优惠,很多大牌产品,提供了很多优惠,比如说海尔电器单件最高可以减2000元。奶粉尿裤低至499元减120元

    2024-03-13 18:23
  • 京东618哪天最便宜?节奏是怎样的?

    京东618哪天最便宜?节奏是怎样的? 拉长战线就是为了将不同大类的优惠区分开来,每一天都会针对不同大品牌或者特定的单品做活动。,所以用户可以在明确需要买什么之后,记住时间轴直接去商品对应的主题日购买。,所以用户可以在明确需要买什么之后,记住时间轴直接去商品对应的主题日购买。

    2024-03-13 18:22
  • 拼多多商家创建商品数量受限调整

    拼多多商家创建商品数量受限调整 春节期间(2019年2月1日00:00:00至2019年2月10日23:59:59),商品数不足5000的店铺每日创建商品数限制调整为20;商品数超过5000的店铺每日创建商品数限制调整为5。

    2024-03-18 10:49
  • 在手机淘宝一年被搜索100亿次,新品为何如此重要?(淘宝手机销量)

    在手机淘宝一年被搜索100亿次,新品为何如此重要?(淘宝手机销量) 十年前,品牌牛不牛,主要看有没有经典款,如今,新品开始挑大梁了。,通过天猫数据,三顿半发现,当用户在两个月内连续买了50杯咖啡,意味着他有日常喝咖啡的习惯,也更容易长期购买。,2019年,完美日记新品销售额增速超过200%,发布了大都会博物馆联名口红等一系列跨界新品,成为双11第一个销售额过亿的国货彩妆品牌;2018年5月才上线的新品牌王饱饱,在双11推出果味麦片新品后,一举超越桂格、卡乐比等传统

    2024-03-18 09:53
  • 2019年,微商生存法则!

    2019年,微商生存法则! 可过了不久,有人在朋友圈里公布自己要做微商的信息,让亲朋友圈帮忙转发一下。,很多微商做不好,是因为总把问题堆积着没有去解决,并且一遇到难题,就想退缩。,2019年,你也想要抓住微商这个机会,成功逆袭,那么,认真思考一下以上的三个法则吧。

    2024-03-22 21:51
  • 2019年天猫618年中大促活动报名开始时间!

    2019年天猫618年中大促活动报名开始时间! 眼看618年中大促即将到来了,不过许多卖家对于年中大促的活动报名规则并不是很了解。,有的卖家往往因为不清楚各个时间节点,错过了大促。,每满1000元减50元活动报名详情:https://pages.tmall.com/wow/seller/act/618-gps-zsgz?spm=a21go.11172787.0.0618年中促销是每年除了双11、双12以外最大的一波促销活动,想要冲刺年中业绩的商

    2024-03-22 20:56
  • 小红书商家版和普通有什么区别(商品可以买吗)

    小红书商家版和普通有什么区别(商品可以买吗) 现在很多小伙伴们都有看过小红书,小红书是内容营销的,但是在小红书,现在也是可以带货的,大家可以选择在小红书上开店,那么小红书商家版和普通有什么区别?一、小红书商家版和普通有什么区别?1、小红书商家版和用户版一样小红书商家版App登录方式,其实与其他普通用户没有什么两样,各位伙伴们照常登录就可以了,大家在小红书开店的时候一定要注意,提前准备好相关的资料2、小红书是一个生活方式平台和消费决策入口,创始

    2024-03-22 20:47
  • 2019天猫618大促活动商品什么时候会显示活动价格?

    2019天猫618大促活动商品什么时候会显示活动价格?   是什么活动?2019活动商品什么时候会显示活动价格?2019天猫618大促活动节奏是什么?为什么我不在活动会场展示?J1  一、2017天猫618大促活动介绍:  天猫年中促【超级粉丝趴】第一波活动:粉丝节,将在5.25-6.18号上线,主打时间为5.25-5.30,主要针对IP正版授权商家进行招募此次活动是阿里集团首次围绕粉丝经济的大型项目,将针对IP进行招商,为粉丝提供丰富的正版IP授权商

    2024-03-22 20:24