该工作利用了一个名为多模态讽刺检测数据集(MUStARD)的数据库,这是由美国和新加坡的另一个研究团队对内容中的讽刺标签进行标注的一部分,旨在建立他们自己的讽刺检测器。

根据一份新报告,荷兰一所大学的研究团队表示,他们开发了一种能够识别讽刺的人工智能(AI)平台。

《卫报》在周四报道,这项研究在加拿大渥太华举行的美国声学学会和加拿大声学协会会议上进行了展示。会上,博士生高熙源(Xiyuan Gao)表示,研究团队使用了来自美国情景喜剧《老友记》和《生活大爆炸》的视频剪辑及其他文本和音频内容来训练一个神经网络。

该工作利用了一个名为多模态讽刺检测数据集(MUStARD)的数据库,这是由美国和新加坡的另一个研究团队对内容中的讽刺标签进行标注的一部分,旨在建立他们自己的讽刺检测器。

在对数据进行训练后,研究人员表示,他们能够在未经标注的对话中检测到近75%的讽刺。他们补充说,实验室使用合成数据的后续工作进一步提高了这一准确度,尽管这些研究结果尚未发表。

在用于训练AI模型检测讽刺的电视节目内容中,包括《生活大爆炸》的一幕,谢尔顿看到他的朋友兼室友伦纳德试图逃离一间上锁的房间未果;以及《老友记》中的一幕,钱德勒、乔伊、罗斯和瑞秋不情愿地组装家具。

“我们能够可靠地识别讽刺,并且我们渴望进一步发展这一技术,”格罗宁根大学语音技术实验室的研究员马特·科勒(Matt Coler)告诉媒体。“我们想看看能将这一技术推进到什么程度。”

研究项目的另一名成员谢卡尔·纳亚克(Shekhar Nayak)表示,该团队的方法和发现可以帮助AI助手通过检测说话者语音中的负面或敌意情绪,更容易地与人类交流。

高熙源指出,将视觉线索纳入AI工具的训练数据中,可能会使其更能够检测通过面部表情(如挑眉或冷笑)传达的讽刺。格罗宁根大学研究团队和标注了讽刺内容数据库MUStARD的研究人员对AI驱动的讽刺检测表现出的兴趣,延续了近年来美国国防部进行的类似研究。

五角大楼的国防高级研究计划局(DARPA)和中佛罗里达大学的研究人员使用DARPA的社会模拟(SocialSim)项目开发了一种能够分类文本(如社交媒体帖子或短信)中是否包含讽刺的AI模型。

DARPA在2021年写道:“团队通过在来自社交网络平台和在线媒体的多个数据集上取得最先进的结果,展示了其方法的有效性。该模型在主要的推特基准数据集上成功预测讽刺,取得了几乎完美的讽刺检测分数,并在其他四个重要数据集上取得了最先进的结果。”

“准确检测文本中的讽刺只是开发这些模拟能力的一小部分,因为人类交流中使用的语言技术极其复杂多样。然而,知道何时使用讽刺对于教导模型了解人类交流的样貌以及随后模拟在线内容的未来发展是有价值的,”它补充道。

© 版权声明

相关文章

返回顶部