

研究人员开发了一种新的方法,使用新的多任务学习(MTL)模型,更准确、更一致地自动检测社交媒体平台上的仇恨言论;一种跨多个数据集工作的机器学习模型。
网络仇恨言论的传播会加深政治分歧,使弱势群体边缘化,削弱民主,并引发现实世界的危害,包括增加国内恐怖主义的风险。
悉尼科技大学(UTS)行为数据科学实验室负责人、副教授玛丽安-安德烈·里佐乌(Marian-Andrei Rizoiu)正致力于打击网络错误信息和仇恨言论的第一线。他的跨学科研究结合了计算机和社会科学,以更好地理解和预测人类在网络环境中的注意力,包括在数字渠道上影响和分化意见的言论类型。
Rizoiu副教授说:“随着社交媒体成为我们日常生活的重要组成部分,自动识别仇恨和辱骂内容对于打击有害内容的传播和防止其破坏性影响至关重要。”
“设计有效的仇恨言论自动检测是一项重大挑战。目前的模式在识别所有不同类型的仇恨言论方面不是很有效,包括种族主义、性别歧视、骚扰、煽动暴力和极端主义。
“这是因为目前的模型只在数据集的一部分上进行训练,并在同一数据集上进行测试。这意味着当他们面对新的或不同的数据时,他们可能会挣扎,不能始终如一地表现。”
Rizoiu副教授在《计算机语音与语言》杂志上发表的论文《利用多任务学习概括仇恨言论检测:政治公众人物的案例研究》中概述了这一新模型,该论文与合著者、UTS博士候选人袁兰琴(Lanqin Yuan)合著。
多任务学习模型能够同时执行多个任务,并在数据集之间共享信息。在这种情况下,它接受了来自Twitter(现在的X)、Reddit、Gab和新纳粹论坛Stormfront等平台的8个仇恨言论数据集的训练。
然后,MTL模型在一个独特的数据集上进行了测试,该数据集包含来自15位美国公众人物的30万条推文,这些公众人物包括前总统、保守派政治家、极右翼阴谋论者、媒体专家和被认为非常进步的左倾代表。
分析显示,谩骂和充满仇恨的推文,通常以厌女症和伊斯兰恐惧症为特征,主要来自右倾人士。具体来说,在5299个谩骂帖子中,有5093个是右翼人士发的。
“仇恨言论不容易作为一个概念来量化。它与攻击性言论和其他虐待性内容,如欺凌和骚扰,是一个连续体。”
联合国将仇恨言论定义为“基于个人或群体的身份(包括其宗教、种族、性别或其他身份因素)攻击或使用贬义或歧视性语言的任何形式的言论、书面或行为交流”。
MTL模型能够区分侮辱性言论和仇恨言论,并识别特定主题,包括伊斯兰教、妇女、种族和移民。
更多资料:袁兰琴等,基于多任务学习的仇恨言论检测:以政治公众人物为例,计算机语音与语言(2024)。引文:多任务学习模型增强仇恨言论识别(2024,10月14日)检索自https://techxplore.com/news/2024-10-multi-task-speech-identification.html。本文受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。