首页 电商 正文

维基百科打算用Meta的AI技术核实引用来源的可靠性 未来的事实核查、纠错

2024-03-21 20:14
admin

作为全世界最大的免费百科全书维基百科,成为很多人免费获取知识的知识库。不过该网站的众包编辑模式使得内容并不一定准确,而且容易存在偏见。

维基媒体基金会是监督维基百科的非营利组织,该基金会定期探索这些缺陷的新解决方案,而最近的举措就是尝试利用利用了人工智能技术解决问题。

该基金会最近与Meta合作以改进维基百科的内容引用情况。这些参考文献通常用于证实网站上的众包信息,不过往往存在丢失、不完整或不准确的问题。

虽然维基百科志愿者会检查这些脚注,但由于数据量太大(每月添加新文章超过17,000篇),人工审核速度是很难跟上的,而使用AI技术或许能弥补这种不足。

Meta的提供的解决方案主要是核实参考文献的真实性。该团队表示,这是第一个可以一次自动扫描数十万条引用检查内容准确性的模型。

该模型包含1.34亿个公共网页的新数据集。Meta表示,这个开源库被称为Sphere,比用于此类研究的任何语料库都更庞大、更复杂。

(Sphere项目网址:

https://github.com/facebookresearch/sphere?fbclid=IwAR335-UftdoqMlLpl-hlzExAMrojoE7r9SzkCWAT3i_tZN4GZQdT_F41fOA)

为了在数据集中找到合适的来源,研究人员在400万次维基百科引用上训练了他们的算法。这使系统能够查找到单个来源,并验证每个语句真实性。

这种“证据排序模型”将替代原始来源参考形式。如果引用内容关联度不大,系统将推荐更好的来源,以及支持该主张的特定段落。然后,人工编辑可以审查并批准该建议。

该团队现在的目标是将这项研究变成一个全面系统。他们计划创建一个平台,让维基百科编辑可以使用该平台系统地发现和解决引用问题。

Meta还开源了该项目,这为外部研究人员开发自己的人工智能语言系统提供了新的工具。

研究作者写道“我们的研究结果表明,基于人工智能的系统可以与人类一起提高维基百科的可验证性。”

“更普遍的说,我们希望我们的工作可以用来协助事实核查工作,并提高在线信息的总体可信度。”

这项研究可能会进一步加剧人们对自动化事实核查和大型科技公司成为真相仲裁者的担忧。更乐观的观点是,Meta终于找到了一种检验错误信息的方法。

相关文章

  • 楼层这么高,为什么蟑螂仍能飞檐走壁,寄居家中?

    楼层这么高,为什么蟑螂仍能飞檐走壁,寄居家中? 蟑螂不仅恶心坏了一大批人,更可能携带多种细菌、病毒和寄生虫,传染各种疾病。,而蟑螂本身体型扁平,重心紧贴地面,从受力的角度来讲更容易贴附在墙上。,它们能出现在十几层的高楼中,可不是靠生生沿着外墙爬进屋里。

    2024-03-22 07:45
  • 带你去全宇宙最冷的地方逛逛!一起看看“冷”有没有“下限”

    带你去全宇宙最冷的地方逛逛!一起看看“冷”有没有“下限” 现代人可以躲在屋里吹空调,古代君王往往选择奔向各大避暑山庄等气温相对较低的地方。,等等,节奏太快,等温过程,绝热过程都是啥?在前面我们已经认识了等压过程,而等温过程指的是在整个过程中系统的温度不变,而绝热过程就是整个过程中系统内部和外部之间完全没有热量交换。,由能斯特定理可以推出:不可能用有限的过程把温度降到绝对零度,这条规律又被称作热力学第三定律。

    2024-03-22 07:15
  • 维基百科网站即将大幅改版

    维基百科网站即将大幅改版 DoNews9月25日消息(记者刘文轩)知名线上百科全书网站维基百科(Wikipedia)在过去20年来,已经拥有5300万个条目,支持各种语言,但用户界面始终没有任何明显变化,一些元素看起来甚至有些过时。,2019年5月起,维基媒体基金会启动一项多年计划,着手于改进维基百科桌面版的用户界面,包括重新组织logo、可折叠侧边栏、目录列表等。,维基百科最初在2001年上线,由维基媒体基金会运营,提供

    2024-03-21 21:46
  • 探讨APP盈利模式,看APP赚钱的一般模式 维基百科前生竟是成人站点,一个你不知道的维基百科创业故事(Wikipedia)

    探讨APP盈利模式,看APP赚钱的一般模式 维基百科前生竟是成人站点,一个你不知道的维基百科创业故事(Wikipedia) 就当下而言,开发者依然能够找寻机遇找准目标,创造出有价值的应用,为移动互联网添砖加瓦。,不过,伦敦却鲜少展露出任何硅谷的气质,而威尔士愉快地填补了这一空白。,在掉线好几次之后,威尔士提议将会议移至即时通讯平台进行——这个建议并没被采纳。

    2024-03-21 16:02