头条新闻

信工所18篇论文被顶级国际会议ACL2021和IJCAI2021录用

发布时间:2021-06-15

  ACL 2021IJCAI 2021分别于56日、429日公布了论文接收结果。中国科学院信息工程研究所有12篇论文被ACL 2021录用(主会论文7findings论文5)、6篇论文被IJCAI 2021录用。

  第59ACL-IJCNLP The Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language ProcessingACL-IJCNLP 2021)计划于202181-86日以线上会议形式召开。ACL年会是计算语言学和自然语言处理领域最重要的顶级国际会议,是中国计算机学会(CCF)推荐的A类国际学术会议。

   

  第30IJCAIthe 30th International Joint Conference on Artificial IntelligenceIJCAI 2021)计划于2021821-826日以线上会议形式召开。IJCAI是人工智能领域的顶级国际会议,是中国计算机学会(CCF)推荐的A类国际学术会议。IJCAI 2021收到有效投稿4204篇,最终录用587篇,录用率13.9%

   

  下面是录用论文列表及介绍:

  1.论文题目:Check It Again: Progressive Visual Question Answering via Visual Entailment 

  作者: 佀庆一,林政,郑明钰,付鹏,王伟平

  类型:ACL 2021Long Paper 

  论文概述:虽然大量的神经网络模型已经在视觉问答任务下取得了不错的成就,但是这些模型倾向于仅利用问题和答案之间的表面联系来回答问题。当前已经有了一些方法尝试解决这个语言偏见问题,然而,它们仅将预测概率最高的答案直接作为预测结果而不去检查答案的真实性。同时,这些模型仅仅探索了图像和问题间的交互而忽略了候选答案的语义信息。因此,本文提出了基于视觉蕴含的select-and-rerank(SAR)渐进式框架。具体来说,先挑选出和答案以及图片最相关的候选答案,然后将这些候选答案通过视觉蕴含任务进行重排序。重排序模块所采用的视觉蕴含任务可以验证一个图片是否语义蕴含问题和每个候选答案组成的陈述,然后根据语义蕴含程度完成排序。本文提出的框架不仅在VQA-CP v2数据集上建立了一个有着7.55%性能提升的新SOTA,而且本文对该框架每个模块的一系列设计和选择进行了实证研究,研究结果可为该领域的研究人员提供有用的参考。

   

  2.论文题目:Marginal Utility Diminishes: Exploring the Minimum Knowledge for BERT Knowledge Distillation 

  作者: 刘源鑫,孟凡东,林政,王伟平,周杰

  类型:ACL 2021Long Paper 

  论文概述:知识蒸馏技术在BERT压缩中取得了很大的成功。前人研究发现,BERT的隐层知识(Hidden State Knowledge (HSK))中包含丰富的信息,因此蒸馏HSK会比传统的蒸馏输出概率取得更好的效果。为了更充分地利用BERT的隐藏层信息,前人工作通常致力于把更多的HSK加到蒸馏中。然而,本文发现HSK蒸馏中存在边际效益递减现象:蒸馏带来的效果提升随着HSK量的增加快速下降(下图在两个学生模型和四个任务上展示了该现象)。为了理解这一现象,本文进行了一系列的实验分析:将HSK分成了模型深度、文本序列长度和模型隐层宽度三个维度。然后,对每个维度单独压缩,探索如何找出重要的知识,在此基础上对三个维度综合压缩。本文发现:1)提取重要的知识可以提升学生模型的效果,2)只用一小部分的HSK就可以取得和全量HSK相当的效果。基于第二个发现,本文提出了一种更加高效的BERT蒸馏范式。此范式不需要在蒸馏过程中在线调用教师模型,从而可以提高训练速度。

   

  3.论文题目:Towards Propagation Uncertainty: Edge-enhanced Bayesian Graph Convolutional Networks for Rumor Detection 

  作者:卫玲蔚,胡斗,周薇,岳兆娟,虎嵩林

  类型:ACL 2021Long Paper 

  论文概述:谣言检测是社交媒体中一项非常重要的任务,对经济、公共卫生等有着重大影响。现有研究工作常常致力于从谣言的文本和传播结构中挖掘有效特征,但是,由于狡猾的谣言发布者以及数据收集的局限性,传播结构中不可避免地包含不可靠的传播关系,引发传播结构不确定性问题。本文尝试探究谣言检测中的传播不确定性。具体地,本文提出一种基于边增强的贝叶斯图卷积网络模型以捕获更鲁棒的结构特征。该模型采用贝叶斯方法自适应地学习传播关系的可靠性。此外,本文设计了一个基于边一致性的训练框架,通过加强传播一致性来优化模型。本文在三个公开基准数据集上的实验表明,本文提出的模型相比基线方法有较好的检测性能。

   

  4.论文题目:Label-Specific Dual Graph Neural Network for Multi-Label Text Classification 

  作者: 马千雯,袁春园,周薇,虎嵩林

  类型:ACL 2021Long Paper 

  论文概述:多标签文本分类是自然语言处理的基本任务之一。以往的研究很难区分相似的标签,因为它们为不同标签学习了相同文档表示,也就是说,它们没有明确地从文档中提取特定于标签的语义组件。此外,它们没有充分探索这些语义组件之间的高阶交互作用,这对预测尾部标签非常有帮助。在本文中,我们提出了一种新的标签特定的双图神经网络(LDGN),它结合类别信息从文档中学习标签特定组件,并分别利用基于统计标签共现和动态重构图两种图卷积网络,联合建模这些组件之间自适应的交互关系。在三个公开数据集上的实验结果表明,LDGN模型的性能明显优于最新的模型,并且在尾部标签方面也取得了更好的性能。

   

  5.论文题目:Improving Encoder by Auxiliary Supervision Tasks for Table-to-Text Generation 

  作者: 李亮,马灿,岳银亮,呼大永

  类型:ACL 2021Long Paper 

  论文概述:Table-to-Text Generation旨在基于结构化的表格中的数据自动生成文本,帮助人们便捷地获取表中的重要信息。虽然表格到文本的神经网络模型已经取得了显著的进展,但仍有一些问题被忽视。我们发现,以往的方法无法从实体(球员或球队)的表现和实体之间的关系推导出事实性的结果。为了解决这一问题,我们首先从输入表构建一个实体图,并引入一个推理模块对实体图进行推理。此外,我们注意到,表中不同维度的记录之间存在不同的关系(如数值大小关系和重要性关系)。这些关系可能有助于数据到文本的生成。然而,普通编码器很难捕获记录间的这些关系。因此,我们提出利用两个辅助任务,数值排序(Number RankingNR)和重要性排序(Importance RankingIR),来监督编码器捕获不同维度记录间的关系。在ROTOWIRERW-FG上的实验结果表明,本文提出的方法在BELU、内容选择(content selection)、内容编排(content ordering)指标上均优于以往的方法。同时,为了证明我们提出的方法具有良好的泛化性能,我们选择显式建模内容选择和规划的NCP方法作为baseline,将我们提出的推理模块和两个辅助任务迁移到NCP上。实验表明,我们的方法不仅可以很容易地与NCP进行结合,同时可以显著地提高NCP在上述几个指标上的表现。

   

  6.论文题目:Enhancing Zero-shot and Few-shot Stance Detection with Commonsense Knowledge Graph 

  作者: 刘睿,林政,谭宇彤,王伟平

  类型:Findings of ACL 2021Short Paper 

  论文概述:立场检测旨在自动识别用户对给定目标的立场。本文考虑了一个在现实中更具应用潜力的场景,即zero-shotfew-shot立场检测,该场景要求模型在没有或有很少训练样本的情况下识别出针对各种主题的立场,而传统的数据驱动方法不适用于上述zero-shotfew-shot的场景。对人类来说,常识是理解和推理的关键要素。在没有标注数据或用户立场表达模糊的情况下,本文认为引入语义关系知识作为推理支持,可以进一步提高模型在zero-shotfew-shot场景下模型的泛化和推理能力。具体来说,本文引入了一个常识知识增强模型来利用关系知识的结构和语义信息。大量实验表明,该模型在zero-shotfew-shot立场检测任务上优于现有的方法。

   

  7.论文题目:Deep Differential Amplifier for Extractive Summarization 

  作者: 贾瑞鹏、曹亚男、方芳、周玉晨、方正、刘燕兵、王石

  类型:ACL 2021Long Paper 

  论文概述: 对于句子级别的抽取式摘要标签为 1 和标签为 0 的句子个数不成比例这会导致在优化分类时分类器弱化某些摘要特征。 这种抽取式摘要中句子分类的不平衡是固有的不能通过数据采样或数据增强算法轻松解决。 为了解决这个问题我们将单文档提取摘要视为再平衡问题并提出了一种深度差分放大器框架来增强摘要句子的特征。 具体来说我们计算并放大每个句子与其他句子之间的语义差异并应用残差单元来深化差分放大器架构。 此外我 们采用加权交叉熵来对平衡目标函数。 在两个基准数据集上的实验结果表明我们的摘要器与最先进的方法相比具有竞争力。

   

  8.论文题目:CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction 

  作者: 盛傢伟,郭舒,郁博文,李倩,黑一鸣,王丽宏,柳厅文,许洪波

  类型:Findings of ACL 2021Long Paper 

  论文概述:事件抽取是信息抽取的基本任务之一,旨在从文本中识别事件的类型、触发词和论元。以往的研究往往假设事件独立的在文本中出现,使得难以适用于重叠事件抽取问题。本文探索了现实中的重叠事件抽取问题,包括触发词重叠问题和论元重叠问题。为了解决以上问题,本文提出一个联合学习框架,通过级联解码的方式,依次完成类型识别、触发词抽取和论元抽取任务。具体的,在抽取触发词和抽取论元时,根据给定的条件信息来抽取对应目标,从而解决重叠要素的抽取问题。在公开数据集上的实验验证了本方案的有效性,和现有方法相比在重叠事件抽取问题上取得较大的性能提升。

   

   

  9.论文题目:Few-Shot Event Detection with Prototypical Amortized Conditional Random Field 

  作者: 从鑫,崔诗尧,郁博文,柳厅文,王玉斌,王斌

  类型:ACL Findings 2021Long Paper 

  论文概述:事件检测是信息抽取的基本任务之一。传统事件检测方法大都基于标准监督学习范式,难以处理只有少量标注样本的新事件类型。而以往的少样本事件检测方法遵循了先判断事件触发词边界再根据上下文语意对其进行分类的范式,这样的方案忽略了不同事件类型之间的事件触发词存在差异,从而导致无法抽取出新事件类型的触发词。为了解决这个问题,本文将少样本事件检测任务转化成一个基于统一标注的序列标注任务,同时建模触发词边界和事件类型之间的关系。而序列标注模型需要建模标签之间的依赖关系,在已有事件类型的数据上学习标签依赖关系难以迁移到新事件类型上。为此我们提出了一个原型均摊条件随机场(PA-CRF)模型,它使用各个标签的原型向量估计标签间的依赖关系。进一步地,我们采用高斯分布对其进行分布估计以减少数据稀少所带来的估计不稳定性。在公开数据集上的实验结果表明,我们的模型的性能明显优于最新的模型。

   

   

  10.论文题目:From What to Why: Improving Relation Extraction with Rationale Graph 

  作者: 张振宇,郁博文,舒晓波,薛梦鸽,柳厅文,郭莉

  类型:Findings of ACL 2021, Long Paper 

  论文概述:作为自然语言处理和信息抽取领域的基础任务之一,关系抽取旨在判断两个实体在文本中所表述的语义关系类型。其中,实体类型和关系触发词是关系表达中最重要的两种指示性信息,同时也是人类判断关系的重要理据。纵观整个数据集,我们发现,此类指示性信息通常与特定关系标签共同出现。在本文中,我们统计全部数据并构造关系理据图来组织实体类型、关系触发词、关系标签之间的全局共现概率,设计模型先预测实体类型和关系触发词,再依据预测结果从关系理据图中获取相关的全局理据知识来提升关系抽取模型性能。两个公开数据集上的实验结果验证了本方法的有效性,尤其在数据量较少的场景,这种关系理据增强的方法带来的提升更为显著。

   

  11. 论文题目:Multimodal Fusion with Co-Attention Networks for Fake News Detection 

  作者: 吴洋,詹鹏伟,张云剑,王利明,徐震

  类型: Findings of ACL 2021, Long Paper 

  论文概述:带有图像和文字的假新闻相比纯文本假新闻有更好的叙事能力,因而可以在社交媒体上被更快的传播。人们分辨真假新闻的能力不足,很容易被这类假新闻欺骗,而传统上使用专家鉴别的假新闻检测费时费力。因此,自动化检测假新闻成为一个热点问题。现有方法对多模态特征进行直接拼接而忽略了多个模态特征之间的关系,这使得多模态特征没有被很好的融合。受人类阅读图文新闻的方式启发,我们提出了多模态互注意力网络(MCAN)来更好的融合多模态特征,并用于假新闻检测。在两个公开数据集上的实验结果证明我们的模型能够学习多模态特征之间的内部依赖,并且在性能上取得了SOTA的成绩。

  12.论文题目:Discontinuous Named Entity Recognition as Maximal Clique Discovery 

  作者:王雨城,郁博文,朱红松,柳厅文,于楠,孙利民

  类型:ACL 2021Long Paper 

  论文概述:命名实体识别在实体提及不连续的时候存在条件。现存方法通过将识别过程打断成几个连续步骤进行处理。在训练过程中,在基于前一个步骤的模型输出进行推断时,这些方法预测的黄金中间结果存在岷县的偏差。为了解决这个问题,本文首先为每个句子创建一个片段图,图中每个节点代表一个片段(在片段上的连续实体,或者不连续实体的一部分),每条边连接两个属于同一个实体的两个节点。节点通过在一个网格标签框架过程中生成,而边则通过一个被称为Mac的新型架构联合学习过程生成。这样,不连续的命名实体识别过程就能够被重新表达为一个在图中发现最大团簇的非参过程和一个将每个团簇中跨度连接在一起的过程。在三个标准集的实验结果表明,本文的方法比当前最佳结果还要好,F1指标提升了3.5%,并且实现了5倍的处理加速。

   

    

  13.论文题目:Detecting Deepfake Videos with Temporal Dropout 3DCNN 

  作者: 张岱墀,李晨钰,林繁钊,曾丹,葛仕明

  类型:IJCAI 2021Long Paper 

  论文概述:近几年Deepfake伪造人脸图像视频的技术给人类社会带来了严重影响,基于其生成的伪造视频每帧的逼真度都很高,这给其检测带来了巨大的挑战。为了解决这个问题,考虑到视频帧与帧之间可能存在的不一致线索,我们提出了一种时域Dropout3维卷积神经网络模型(TD-3DCNN)进行Deepfake视频的检测。此模型将视频中采样的定长帧序列输入到设计的带有可视域扩展模块的3D卷积神经网络(3DCNN)中,以提取不同尺度的特征,同时通过引入的时域Dropout模块对训练每个epoch中的采样帧序列进行随机丢弃。时域Dropout模块作为一种简单而有效的数据扩充方式,可以增加模型表征和泛化能力,避免模型过度拟合并提高检测精度。我们在目前广泛使用的Celeb-DF(v2)FaceForensics++DFDC深度伪造数据集上进行的实验表明所提出的方法具有令人印象深刻的检测准确率与泛化能力。在Celeb-DF(v2)DFDC数据集上的检测AUC指标超过当前最好方法10%以上,使用t-SNE方法对表征进行聚类可视化的结果也表明该模型能提取到鲁棒且高效的表征。

   

  14.论文题目:Learning Class-Transductive Intent Representations for Zero-shot Intent Detection 

  作者: 佀庆一,刘源鑫,付鹏,林政,李江楠,王伟平

  类型:IJCAI 2021Long Paper 

  论文概述:零样本意图识别(Zero-shot intent detection, ZSID)旨在解决接连不断的没有标注训练数据的意图。然而,现有的ZSID系统有着两个局限性:1.他们不能很好的建模seenunseen意图之间的关系;2.他们不能有效的在广义零样本意图识别(Generalized Zero-shot Intent Detection, GZSID)设定下识别unseen意图。这两个局限性背后的关键问题是无法在训练阶段学习unseen意图的表示。为了解决这个问题,本文提出了一个能够利用unseen类别标签来学习Class-Transductive Intent Representations(CTIR)的新颖框架。具体来说,本文将unseen意图对应的标签名称作为其对应的输入语句,从而允许模型在训练阶段预测unseen意图。在这个基础上,本文引入了一个多任务学习的优化目标,鼓励模型学习意图间的区别,同时本文提出了一个相似度打分器来更准确地估计模型间的联系。CTIR能够非常容易地拓展到现有的ZSIDGZSID方法中去。大量实验表明本文提出的框架相较于基线模型有着明显的性能提升。

   

  15.论文题目:Rescuing Deep Hashing from Dead Bits Problem 

  作者: 赵澍,吴大衍,周玉灿,李波,王伟平

  类型:IJCAI 2021Long Paper 

  论文概述:深度哈希因其高效的存储和计算能力被广泛应用于大规模视觉检索领域。深度哈希里的一个重要问题是随着训练的进行,越来越多的比特位陷入死亡陷阱而无法继续优化,造成此现象的原因是在量化时采用的激活函数存在梯度消失现象。同时,目前广泛使用的量化损失函数也会加剧这一现象。针对上述问题,本文提出一个梯度放大器,能够有效缓解梯度消失现象,将比特位从死亡陷阱中拯救出来。同时,本文提出一种能够感知错误的量化损失函数,使得比特位的量化方向能够基本保持和主函数的优化方向一致,进一步减小了比特位陷入死亡陷阱的可能性。本文在三个国际公开的图像检索数据集上进行了大量的实验,结果验证了本文所提梯度放大器和量化损失函数的有效性。

   

  16.论文题目:HIP Network: Historical Information Passing Network for Extrapolation Reasoning on Temporal Knowledge Graph 

  作者: 何永全、张鹏、刘陆琛、梁棋、张文源、张闯

  类型:IJCAI-2021Long Paper 

  论文概述:近年来,时序知识图谱推理受到了广泛的关注。大多数现有的方法假设所有的时间戳和相应的图在训练过程中都是可用的,这使得预测未来事件变得困难。为了解决这个问题,最近的研究学会了根据历史信息推断未来的事件。然而,这些方法没有全面考虑时间变化背后的潜在模式,以有选择地传递历史信息,适当地更新表示,准确地预测事件。在本文中,我们提出了历史信息传递网络来预测未来事件。本方法从时间、结构和重复的角度传递信息,分别用于模拟事件的时间演化、同一时间步的事件相互作用和已知事件的重复发生。特别地,我们的方法考虑了关系表示的更新,采用了与上述维度对应的三个评分函数。在五个基准数据集上的实验结果表明了所提方法的优越性,在Hits@1上的显著改进证明了我们的方法可以更准确地预测将要发生的事情。

   

  17. 论文题目:CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation 

  作者: 于静,柴源,汪瑜静,胡玥,吴琦

  类型:IJCAI 2021, Oral 

  论文概述:视觉场景图是图像语义信息的结构化表达,也是跨越视觉和语言之间鸿沟的重要桥梁,在视觉问答、视觉对话、跨媒体检索等视觉-语言任务上都有着广泛应用。由于数据收集、数据标注过程存在严重偏置,使场景图中目标之间关系存在显著的长尾分布现象,也导致视觉场景图生成模型存在严重偏置,难以准确识别语义丰富的、细粒度的视觉关系。现有去除偏置的方法主要从平衡数据、学习无偏特征、因果推理等角度解决数据偏置问题,忽略了具有偏置的不同类别之间的关联关系。本论文首次从人类认知机理的角度解决无偏场景图生成问题:首先,基于有偏置模型的预测结果,自动构建具有偏置的视觉关系的认知结构——认知树(Cognition Tree, CogTree),再基于该结构,提出一种层次判别损失(CogTree Loss),逐层区分具有显著区分度的类别以及具有细微差别的类别,支持模型对视觉关系从粗粒度到细粒度的有效区分。该损失函数作为一个模型无关方法,有效提升了现有多种场景图生成模型效果,达到了目前该任务的最佳效果。值得一提,该方法在关系抽取、流量分类等不同领域的去偏任务中,都取得了显著成效。该论文arxiv链接:https://arxiv.org/abs/2009.07526。该论文代码已公开:https://github.com/CYVincent/Scene- Graph-Transformer-CogTree 

   

   

  18.论文题目:Exploring Periodicity and Interactivity in Multi-Interest Framework for Sequential Recommendation 

  作者:陈高德,张兴华,赵炎炎,薛聪,向继 

  类型:IJCAI—2021Long Paper 

  论文概述:序列推荐系统缓解了信息过载的问题,并引起了越来越多的关注。大多数先前的工作通常是基于用户的行为序列来获得整体表示,这不能充分反映用户的多种兴趣。为此,我们提出了一种称为 PIMI 的新颖方法来缓解这个问题。通过同时考虑项目序列中的周期性和交互性,PIMI 可以有效地对用户的多兴趣表示进行建模。具体来说,我们设计了一个周期性感知模块来利用用户行为之间的时间间隔信息。同时,提出了一种巧妙的图来增强用户行为序列中项目之间的交互性,它可以捕获全局和局部项目特征。最后,基于获得的项目表示,应用多兴趣提取模块来获得用户的多兴趣。在亚马逊和淘宝这两个真实世界数据集上的大量实验表明,PIMI 始终优于最先进的方法。