网易首页 > 网易号 > 正文 申请入驻

揭秘AI识别虚假新闻背后的原理

0
分享至

我们生活在一个信息横流的时代,有时不免会受到网络上虚假信息的干扰。大多数时候,网民并不是假新闻的直接制造者,而更多是扮演传播者的角色。而散播谣言与捏造谣言一样,也会带来严重的后果,例如 2016 年美国大选期间在社交网络上疯传,被指左右了民意的假新闻,再比如今年通过 WhatsApp 平台传播,最终导致印度十余人因私刑而死亡的虚假流言。

据科技媒体 Science News 报道,全球多个科研团队已在研发可自动识别新闻真伪的程序。它们的主要功能是对新闻的可信度做一个初步的鉴定,并将结果传递给读者以供其参考。

印第安纳大学布鲁明顿分校的计算机科学家 Giovanni Luca Ciampaglia 表示,业内对这种鉴定算法的开发目前普遍处于起步阶段,对于一篇报道,选取哪些因素作为判定其可信度的方法也是五花八门。

不过这些程序对一则新闻的关注点大致可分为两类:报道的内容和叙述的口吻。

上文提到的 Ciampaglia 和他的科研团队就着眼于报道的主要观点,主语和宾语间的联系有无客观事实支撑。他们的算法收纳了大量 Wikipedia 词条页面的右侧信息栏(“Infobox”)中的信息,并将主词条与所有副词条配对,形成一个以名词及名词间联系为主的数据库。如果一篇报道的主要观点中,主语与后面的描述性名词之间的联系能在该数据库中以较短路径追溯到,那么这条新闻的主旨就相对可信。

比如“奥巴马是个穆斯林”这句话中,“奥巴马”和“穆斯林”之间存在 7 重联系,也就是说在数据库中需要跨越 7 组名词间的两两配对才能将这两个词扯在一起,这说明该言论是不太靠得住的。

图|奥巴马 wiki 页及右侧的 infobox(来源:Wikipedia)

但这种基于名词间关联强度的判定方法也有一定局限性。比如,它无法判定“George W. Bush(小布什)娶了 Barbara Bush(芭芭拉·布什,小布什老妈)”这句话的真伪,因为在数据库中这两个名词高度相关。因此 Ciampaglia 也正设法为他的算法添加其他参数以提升其合理性。

图|“奥巴马”与“穆斯林”间的 7 重联系(来源:Science News)

美国伦斯勒理工大学的计算机科学家 Benjamin Horne 和 Sibel Adali 则提出了另一个方法。他们分析了由 Business Insider 评定的最值得信赖媒体发布的 75 篇真实报道,以及网上公认的 75 篇伪新闻,随后总结出:假新闻通常篇幅比真的短,会重复性地出现许多副词,其中的引述和专业词汇也相对更少。

他们由此建立了一套以文章所含名词数量、引述数量、冗长度以及总字数为参数的评定算法。该算法曾在去年于加拿大蒙特利尔举行的网络与社会媒体国际研讨会(International Conference on Web and Social Media)上做现场演示,并在辨别假新闻时准确率达到了 71%。

密歇根大学安娜堡分校的计算机科学家 Verónica Pérez-Rosas 同样发现假新闻中的副词使用频次要高于真新闻。在 2017 年 8 月发布于科学文献数据库 arXiv.org 的研究报告中,Pérez-Rosas 也提出,假新闻会使用更多正面措辞,并且更喜欢下结论。

图|Pérez-Rosas 总结出的真(左半)假(右半)新闻分别惯用的词汇(来源:Science News)

由此可见,假新闻在写作手法上有共通之处。加州大学河滨分校的计算机科学家 Vagelis Papalexakis 就根据两篇报道间的行文相似度来判定它们的真伪。虽然他在研究报告中并未明确列出衡量相似度的具体参数,但在包含真假新闻各 32000 个的数据库中,他的算法能在预知其中 5% 的文章哪些是真哪些是假的情况下,以 69% 的准确率判定出其他文章的真伪。

社交网站可以用这些算法来给新闻做初步检查,并在用户打开一篇疑似假新闻时,给用户发一个预警提示。比如目前 Facebook 就会在后台监测哪些新闻下多了质疑性评论,然后专业人员会对这些新闻做出评定,并将评定结果录入 Facebook 原先的自动鉴别算法所用数据库中,从而实现算法的优化。

英国帝国理工学院的计算机科学家 Julio Amador Diaz Lopez 表示,即使目前这些鉴定算法演化得越来越“聪明”,但面对背景较抽象,如宗教、哲学等方面的报道,程序可能还是无法像人类一样会意,或辨识其可信度。同时,如果从写作风格着手的鉴伪程序被广泛采用,那原先假新闻的作者也会适当地改变自己的写作手法以图蒙混过关。

幸好,目前业内已出现了不只关注文字本身的算法。中国科学院计算技术研究所的曹娟提出的算法就着眼于读者的反馈模式。她将微博上用户对新闻的观点分为支持和反对两类。比如对于一条地方新闻,地理位置更接近事发地点的用户做出的评论就比相距较远的读者的反馈更具可信度。再比如一个隐身很久但突然冒出来给一条新闻评论的用户,他的言论可信度也就较低。

曹娟的团队选取了微博上传播的真伪新闻各 73 条,他们的算法通过分析这些新闻下共约 5 万条持支持或反对意见的评论,最终以 84% 的正确率识别出了假新闻。该研究成果也曾在的美国人工智能进步协会(Association for the Advancement of Artificial Intelligence)2016 年大会上展出。

同样,来自北京航空航天大学的网络专家李大庆教授也未把内容作为鉴伪程序的重心,而是把新闻的传播形式当作主要评判依据。他收集了微博上 1700 条假新闻、500 条真新闻,以及推特上真假新闻各 30 条,分析了它们的扩散特征后发现,真新闻的传播主要是靠用户从单个可靠消息源的直接分享,而假新闻的传播则主要依托用户间的分享。

图|李大庆教授发现的真(左)假(右)新闻主要传播形式(来源:Science News)

再回到这些算法的实际应用——社交网站现阶段还不宜单单依据算法判断的结果,将所有疑似假新闻一律屏蔽,这样相当于以极权主义干涉了用户自主选择浏览信息的权利。Facebook 目前的做法是将系统鉴定出的低可信度报道自动置于推送栏底部,据公司发言人 Svensson 表示,这样可以将虚假新闻的阅读量减少约 80%。另外,前文提到的根据初步鉴定结果给用户发警示消息,也可能成为未来社交网站上对此类算法的应用形式之一。

责任编辑:王凤枝_NT2541

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
20位省级政府“一把手”的特别身份

20位省级政府“一把手”的特别身份

政知新媒体
2024-04-24 16:01:25
大使馆:入澳籍仍可享受中国退休待遇!养老金照领,可在线申请

大使馆:入澳籍仍可享受中国退休待遇!养老金照领,可在线申请

澳洲红领巾
2024-04-12 14:55:07
父亲和大伯10年不来往,那天堂哥突然打来电话,我连夜开车赶回去

父亲和大伯10年不来往,那天堂哥突然打来电话,我连夜开车赶回去

好点点
2024-04-19 19:55:21
突发利好!全球股市全线大涨,A股午盘爆拉,财政部、央行超重磅

突发利好!全球股市全线大涨,A股午盘爆拉,财政部、央行超重磅

看财经show
2024-04-24 17:20:52
耿彦波留给大同的这块警示碑再引关注:华严寺综治犯三错,明耻彰过

耿彦波留给大同的这块警示碑再引关注:华严寺综治犯三错,明耻彰过

澎湃新闻
2024-04-24 14:56:28
李宗伟:李永波告诉我,我若在中国肯定能成为世界冠军、奥运冠军

李宗伟:李永波告诉我,我若在中国肯定能成为世界冠军、奥运冠军

直播吧
2024-04-24 15:28:12
菲律宾政坛生变,杜特尔特女儿是否在隐忍?现总统为何极端亲美

菲律宾政坛生变,杜特尔特女儿是否在隐忍?现总统为何极端亲美

照理读史
2024-04-23 18:00:02
周渝民变化好大啊,真认不出来了 。

周渝民变化好大啊,真认不出来了 。

娱乐圈酸柠檬
2024-04-24 15:07:09
突发!特斯拉毁约中国所有应届生,只赔偿1万,众多车企在线抢人

突发!特斯拉毁约中国所有应届生,只赔偿1万,众多车企在线抢人

洛洛女巫
2024-04-24 15:55:20
台积电在美国惨败!军事化管理惹当地工人不满:地球上最烂的工作场所

台积电在美国惨败!军事化管理惹当地工人不满:地球上最烂的工作场所

西游日记
2024-04-24 16:11:26
贾跃亭回应被周鸿祎吐槽:虽然只交付11台车,但却是原创!周鸿祎:先送辆车到360大厦

贾跃亭回应被周鸿祎吐槽:虽然只交付11台车,但却是原创!周鸿祎:先送辆车到360大厦

每日经济新闻
2024-04-24 17:46:19
他们的孩子回来“为人民服务”了…

他们的孩子回来“为人民服务”了…

非虚构故事
2024-04-23 21:38:35
三个反美的国家,紧紧地抱在了一起!

三个反美的国家,紧紧地抱在了一起!

3号视频
2024-04-24 14:33:16
假期前,换届中未连任省委常委的“老虎”,被点名了

假期前,换届中未连任省委常委的“老虎”,被点名了

政知新媒体
2024-04-24 17:52:08
反转!遭强奸的西班牙女网红回国后,揭露印度丑行:身上都是J液,被警方强行隔离

反转!遭强奸的西班牙女网红回国后,揭露印度丑行:身上都是J液,被警方强行隔离

不掉线电波
2024-04-24 17:58:59
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

匹夫来搞笑
2024-04-23 20:40:15
质疑天然气费用被反诈约谈,全方位的权力任性有多可怕

质疑天然气费用被反诈约谈,全方位的权力任性有多可怕

陶舜财经
2024-04-24 12:24:45
基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

毒舌小红帽
2024-04-23 19:12:55
万达集团创始人王健林宣布退出公司并将全部股权转让给中国儒意

万达集团创始人王健林宣布退出公司并将全部股权转让给中国儒意

鹏飞深文
2024-04-22 12:19:28
关于霸凌这事,有网友想到以毒攻毒的办法了

关于霸凌这事,有网友想到以毒攻毒的办法了

清晖有墨
2024-04-24 11:57:22
2024-04-24 20:00:49
DeepTech深科技
DeepTech深科技
麻省理工科技评论独家合作
13759文章数 511300关注度
往期回顾 全部

科技要闻

特斯拉被爆大量毁约应届生 友商"在线抢人"

头条要闻

去年中纪委打掉的3个"正部" 1个被公诉、2个移送检方

头条要闻

去年中纪委打掉的3个"正部" 1个被公诉、2个移送检方

体育要闻

足智多谋的哈姆,温水里的青蛙

娱乐要闻

方媛带两女儿参加婚礼,当花童超可爱

财经要闻

居民气价确实在涨,多地正普遍发生

汽车要闻

续航708公里 极狐阿尔法S5展前现身

态度原创

艺术
健康
教育
数码
军事航空

艺术要闻

艺术名画︱爱尔兰画家大卫·科因的刀画作品

这2种水果可降低高血压死亡风险

教育要闻

我想和它搞好关系,奈何它每次都不给面子!

数码要闻

消息称 AMD 将推 EPYC 霄龙 4004 处理器:AM5 插槽,含 X3D 版本

军事要闻

时隔5年土耳其或首部署俄制防空系统

无障碍浏览 进入关怀版