数据库与信息系统研究室师生论文被国际学术会议CVPR 2022录用
南开大学
计算机学院

数据库与信息系统研究室

数据库与信息系统研究室师生论文被国际学术会议CVPR 2022录用

近日,年度计算机视觉顶级会议CVPR(Conference on Computer Vision and Pattern Recognition,国际计算机视觉与模式识别会议)结果出炉,数据库与信息系统研究室的1篇论文被接收。

CVPR是计算机视觉和模式识别领域的国际顶级学术会议,在中国计算机学会推荐国际期刊和会议中,CVPR为人工智能领域的A类会议,在最新的谷歌学术期刊和会议影响力TOP100榜单中,CVPR位居第四,仅次于Science,今年的 CVPR 于 6 月 19 日至 24 日在美国新奥尔良举办。

以下为论文介绍:

论文题目:PPDL: Predicate Probability Distribution based Loss for Unbiased Scene Graph Generation

作者:李伟, 张海威, 白淇介, 赵国庆, 蒋宁, 袁晓洁

通讯作者:张海威

录用会议/期刊:CVPR 2022

论文概述:近年来,场景图(SG)因其丰富的结构-语义细节而在许多下游任务中具有很高的应用价值,场景图生成(SGG)因而也吸引了越来越多的计算机视觉研究者的注意。然而,场景图训练数据中关系谓词的标注存在严重的长尾分布,造成模型预测关系谓词的语义偏差,从而限制了场景图在下游任务中的应用价值和应用前景。现有的研究工作主要是通过更好地聚合上下文语义和整合外部先验知识来减少预测偏差,但很少考虑到谓词之间的语义相似性。针对场景图生成的长尾偏见问题,本文提出了一种基于谓词概率分布的损失(PPDL)来训练现有的有偏见的SGG模型,并最终获得无偏见的场景图。首先,本文提出一个谓词概率分布作为特定谓词类的语义表示;之后,根据预测的概率分布和估计的概率分布之间的相似性来重新平衡有偏见的训练损失,并最终消除关系谓词预测的长尾偏见。值得注意的是,本文提出的PPDL训练方法的应用与主干模型无关,能够适用于现有的场景图生成模型。在视觉基因组数据集上进行的大量实验和定性分析显示,与最先进的方法相比,本文的方法在尾部类别上有明显的性能改进。

分享到: