网易首页 > 网易号 > 正文 申请入驻

数据科学家必读!5篇情感分析研究论文

0
分享至

全文共3143字,预计学习时长8分钟

图源:unsplash

情感分析用途广泛,能够识别感情与想法的AI模型广泛应用于诸多产业。因此,创造出可智能识别感情的机器日益成为热门。自然语言处理(NLP)的研究也是如此。本文将介绍5篇关于情感分析和情感分类的重要论文。

运用深度学习检测推特上的仇恨言论(Deep Learning for Hate Speech Detection inTweets)

情感分类模型的最重要用途之一是检测仇恨言论。最近有很多关于内容审核人员工作之艰辛的报道,随着自动仇恨言论检测和其他内容审核模型的发展,审查人员有望卸下审核图像内容的重担。

在这篇论文中,研究小组将他们的仇恨言论检测任务定义为对特定的推特帖子进行分类,区分其是否存在种族主义或性别歧视。

为此,研究人员基于包含16000条推文的数据集进行实验。在该数据集中,1972条推文标记为具有种族歧视内容。3383条推文标记为具有性别歧视内容。其余的推文归类为既没有种族主义情感,也没有性别歧视情感。

研究表明,某些深度学习技术能够比现有的N-gram方法更高效地检测仇恨言论。

发布/最近更新日期:2017年6月1日

作者和贡献者:Pinkesh Badjatiya(国际信息技术研究所-海得拉巴,以下简称IIIT-H)、ShashankGupta(IIIT-H)、Manish Gupta(微软)、Vasudeva Varma(IIIT-H)

文章地址:https://arxiv.org/pdf/1706.00188v1.pdf?ref=hackernoon.com

2.depechemod++:双语情感词典(DepecheMood++: a Bilingual Emotion Lexicon)

创建词典的主要途径有两种:直接创建(通常使用众包注释器),或者从现有注释语料库派生。

研究人员的实验目的是:检验文档过滤、降低频率或文本预处理等简单的技术能否用于改善DepecheMood这一最新词典。这本词典由带注释的新闻文章组成,最初由Staiano和Guerini于2014年创建,用于情感分析。

在这篇论文中,研究人员解释了他们是如何创建该词典的。这项研究发布的新版本DepecheMood++有英语和意大利语两种版本。

发布/最近更新日期:2018年10月8日

作者和贡献者:Oscar Araque(马德里理工大学)、Lorenzo Gatti(特温特大学)、Marco Guerini(布鲁诺·凯斯勒研究所)、JacopoStaiano(Recital AI)

文章地址:https://arxiv.org/pdf/1810.03660v1.pdf?ref=hackernoon.com

图源:unsplash

3.粗鄙之语:粗俗言论的社会动力(Expressively Vulgar: The Socio-dynamics ofVulgarity)

大多数思想的表达形式随时间不断演变,而粗俗的语言却并非如此,使用粗俗的语言往往包含表达确切信息的强烈指向。

在这项研究中,德克萨斯大学和宾夕法尼亚大学的研究人员对推特帖子中的粗俗词汇进行了大规模的数据驱动分析。更具体地说,他们的研究分析了推特中粗俗语言的社会文化和语用方面的内容。

研究小组试图回答以下问题:粗俗言论的表达方式和功能是否因该言论发表者的人口特征而不同?粗俗言论是否会影响对情感的感知?对粗俗言论进行建模是否有助于情感预测?

研究人员收集了6800条推文的数据集。接下来,他们让9位评审员用5分制对这些推文进行了情感标注。值得注意的是,数据还包括发布推文者的人口统计数据(性别、年龄、教育程度、收入、宗教背景和政治意识形态)。

这个数据集是唯一一个既包括推文又包括其发布者详细信息的开放数据集。此外,这也是第一次对低俗词建模如何提高情感分析性能的研究之一。

发布/最近更新日期:2018年8月

作者和贡献者:Isabela Cachola,Eric Holgate,Junyi Jessy Li(均来自德克萨斯大学奥斯汀分校)Daniel Preotiuc Pietro(宾夕法尼亚大学)

文章地址:https://www.aclweb.org/anthology/C18-1248.pdf?ref=hackernoon.com

4.多语言推特情感分类:人类注释者的作用(Multilingual Twitter SentimentClassification: The Role of Human Annotators)

在本文所列举的关于情感分析的研究中,这是唯一一个强调人类注释者重要性的研究。在这项自动推文情感分类实验中,来自Jožef Stefan研究所的研究人员分析了一个用多语言推文标注情感的大型数据集。

具体来说,研究小组标注了160万条包含13种不同语言的推文。利用这些注释的推文作为训练数据,团队构建了多个自动情感分类模型。

他们的实验得出了一些有趣的结论。首先,研究人员指出,在统计学上,顶级分类模型的性能没有显著差异。其次,当应用于有序三类情感分类问题时,分类模型的基本准确性与性能无关。最后,研究人员表示应该关注训练集的精确度,而非所使用的训练模型。

发布/最近更新日期:2016年5月5日

作者和贡献者:Igor Mozeti,Miha Grčar和Jasmina Smailovičč(均来自Jožef Stefan研究所知识技术部)

文章地址:https://arxiv.org/pdf/1602.07563v2.pdf?ref=hackernoon.com

5.MELD:一种用于情感识别的多模式多方数据集

图源:unsplash

在这篇论文中,作者就目前会话情感识别领域日益增多的研究进行了解释。同时,他们指出,该领域缺乏大规模的会话情感数据库。为了弥补这一点,研究人员提出了多模式情感线数据集(MELD),它是对原始情感线(EmotionLines)数据集的扩充和增强。

MELD包括了来自电视剧《老友记》的1433段对话中的13000段语音。数据集主要集中于两个以上说话者的对话。此外,每一句话都有情感和情感标签。而EmotionLines这一原始数据集则只包含对话的文本。因此,它只能用于文本分析。数据集的主要改进是增加了音频和视频模式。MELD包括所说的词、说话的语调和说话人的面部表情。

发布/最近更新日期:2019年7月4日

作者和贡献者:Soujanya Poria(新加坡科技设计大学)、Devamanyu Hazarika(新加坡国立大学)、NavonilMajumder(墨西哥国立理工学院)、Gautam Naik(南洋理工大学)、Erik Cambria(南洋理工大学)、Rada Mihalcea(密歇根大学)

文章地址:https://arxiv.org/pdf/1810.02508v6.pdf?ref=hackernoon.com

创造情感智能机器是一个雄心勃勃的目标。为此,情感分析和情感识别是必要的步骤。希望这些论文有助于加强你对该领域目前所做工作的理解。

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月17日夜晚,突然发生一个重大消息!又要来大动作吗?

5月17日夜晚,突然发生一个重大消息!又要来大动作吗?

股市皆大事
2024-05-17 18:17:21
庾澄庆伊能静世纪大同框!两人参加哈利毕业典礼,网友晒现场照

庾澄庆伊能静世纪大同框!两人参加哈利毕业典礼,网友晒现场照

小seven的囧囧啊
2024-05-16 21:51:40
王楚钦财富版图:110万路虎,还是北京车牌!24岁成国乒隐形富豪

王楚钦财富版图:110万路虎,还是北京车牌!24岁成国乒隐形富豪

娱乐八卦木木子
2024-05-17 19:56:50
玩的就是心跳:主场点球绝杀北京国安,长春亚泰逃离降级区

玩的就是心跳:主场点球绝杀北京国安,长春亚泰逃离降级区

姜大叔侃球
2024-05-17 22:52:34
【中国之声独家调查最新回应】山东淄博回应村集体征地补偿款被“理财”:实为代管但未经合法程序

【中国之声独家调查最新回应】山东淄博回应村集体征地补偿款被“理财”:实为代管但未经合法程序

央广网
2024-05-17 10:00:04
热议成都4-1梅州:梅州躺平等降级了,成都管理水平要提升

热议成都4-1梅州:梅州躺平等降级了,成都管理水平要提升

懂球帝
2024-05-17 21:49:13
俄罗斯打到现在,原来一直用养老金撑着!仅仅两年,就消耗了一半

俄罗斯打到现在,原来一直用养老金撑着!仅仅两年,就消耗了一半

青栀伊人
2024-05-14 22:08:15
CBA历史第3人!琼斯总分超朱芳雨 仅需仰望易建联哈德森

CBA历史第3人!琼斯总分超朱芳雨 仅需仰望易建联哈德森

醉卧浮生
2024-05-17 19:45:08
大s尿检:有药物成分,汪小菲霸气回应:有话当面说!

大s尿检:有药物成分,汪小菲霸气回应:有话当面说!

默默有话说
2024-05-17 17:30:24
G7欧盟发布声明,指责中国改变台海现状,中方直接打脸:废纸一张

G7欧盟发布声明,指责中国改变台海现状,中方直接打脸:废纸一张

小六视野
2024-05-17 18:48:22
2比0横扫世界冠军!29岁国羽名将爆出大冷,网友:新王者出现了

2比0横扫世界冠军!29岁国羽名将爆出大冷,网友:新王者出现了

体坛知识分子
2024-05-17 06:15:02
拿更多冠军?克洛普:我做不到,3进欧冠决赛已是了不起的成就

拿更多冠军?克洛普:我做不到,3进欧冠决赛已是了不起的成就

直播吧
2024-05-17 17:54:16
再见山西!张宁获3换1交易离队,最新下家曝光

再见山西!张宁获3换1交易离队,最新下家曝光

条条爱侃球
2024-05-17 22:36:50
妻子每晚都出去打麻将,却从来没输过钱,丈夫在自家地窖找到原因

妻子每晚都出去打麻将,却从来没输过钱,丈夫在自家地窖找到原因

观案宝鉴
2024-05-15 19:00:02
蔡英文离职在即,大陆公布惩戒名单,解放军开始上场,统一更近了

蔡英文离职在即,大陆公布惩戒名单,解放军开始上场,统一更近了

听风听你
2024-05-17 11:38:18
华为余承东亲自爆料新问界M7 29.8万起 颜值大提升!

华为余承东亲自爆料新问界M7 29.8万起 颜值大提升!

手机中国
2024-05-17 10:04:11
《庆余年2》穿帮镜头太多了!庆帝穿运动鞋飞奔,评论区笑不活了

《庆余年2》穿帮镜头太多了!庆帝穿运动鞋飞奔,评论区笑不活了

八卦爱侃娱
2024-05-17 16:44:42
廉价眼泪?拉波尔塔宣布哈维留下时动情万分,几周后决定解雇哈维

廉价眼泪?拉波尔塔宣布哈维留下时动情万分,几周后决定解雇哈维

直播吧
2024-05-17 15:15:01
那英唱《挣脱》!《歌手》第二期歌单公布

那英唱《挣脱》!《歌手》第二期歌单公布

阿芒娱乐说
2024-05-17 19:07:12
孙子长相有问题,我怀疑儿媳不忠,亲子鉴定结果出来我愣住了

孙子长相有问题,我怀疑儿媳不忠,亲子鉴定结果出来我愣住了

小月文史
2024-05-16 16:56:58
2024-05-17 23:28:49
读芯术
读芯术
专注年轻人的AI学习平台
2097文章数 5641关注度
往期回顾 全部

科技要闻

京东拼增长,大力出奇迹

头条要闻

养殖基地被误传"龙虾随便捡" 每晚涌入两三百人"捡"虾

头条要闻

养殖基地被误传"龙虾随便捡" 每晚涌入两三百人"捡"虾

体育要闻

生命最后一年,他决定完成自己的“遗愿清单”

娱乐要闻

《庆余年2》首播口碑出炉!有好有坏

财经要闻

重磅!楼市王炸来了 官方详解保交房新政

汽车要闻

内饰与配置全新升级 全新途观L PRO将于5月30日上市

态度原创

本地
时尚
教育
公开课
军事航空

本地新闻

2024年"519中国旅游日"活动线上启动仪式

飞船学校|张宇凌

教育要闻

真的不一定要早起啊!|二战408分上岸重庆大学新传考研经验帖

公开课

父亲年龄越大孩子越不聪明?

军事要闻

印防长称印度将开始建第三艘母

无障碍浏览 进入关怀版