科学研究

我院康文雄教授团队在计算机视觉顶级期刊IJCV发表论文

2024-05-23


  近日,我院康文雄教授团队的科研成果“L3AM: Linear Adaptive Additive Angular Margin Loss for Video-Based Hand Gesture AuthenticationInternational Journal of Computer Vision(IJCV)录用并在线刊出。IJCV是计算机视觉领域最重要的顶级学术期刊之一,也是中国计算机学会CCF认定的人工智能领域四个A类期刊之一,2024年影响因子为19.5,年发文量仅为170篇左右。该论文第一作者为我院2020级博士研究生宋文伟,指导老师康文雄教授为该论文的共同通讯作者,我院为论文第一署名单位。这也是我院在读研究生首次以第一作者身份在IJCV上发表科研论文。 

该论文从损失函数的角度出发对生物特征识别系统中至关重要的特征提取器进行了改进。通过对现有损失函数的深入研究,提出了一种线性自适应加性角度间隔L3AM损失。论文首先对现有主流损失函数进行了梯度分析。通过推导,我们提出采用线性函数替代基于间隔惩罚的Softmax损失函数中常用的余弦函数来衡量身份特征与代理(Softmax的权重矩阵,可视为类别中心)之间的相似度。采用所提线性相似度度量函数,可以使损失函数主要梯度值在训练过程中随着模型质量的提高而单调递减,从而使模型在训练早期得到快速的优化,在后期阶段得到精确的微调。本文所提L3AM与其它4种主流损失函数的调制梯度值曲线对比如图1所示。

1 典型损失函数的调制梯度值曲线

 所提线性相似度度量函数确保了梯度值单调性满足要求,但在实际应用中,梯度值大小同样十分重要,因此我们通过进一步的梯度分析,提出了一种样本伪间隔并在此基础上设计了一种自适应间隔惩罚方法,从而使模型在每次迭代中可以根据不同样本的可分性和模型的质量来自动分配间隔惩罚。该自适应间隔惩罚方法可以很好地对梯度大小进行约束,可以有效地减少了过大的偏激梯度的产生,并为模型优化提供大小合适的梯度值,从而使模型训练更加稳定。所提样本伪间隔如图2所示。

2 所提出的样本伪间隔 

所提出的线性相似度度量函数和自适应间隔惩罚方法是相辅相成的。通过这两种方法的结合即可得到最终的L3AM损失。为了证明L3AM损失的有效性,我们在7个与人手相关的认证数据集(手势、掌纹和掌脉)上进行了大量的实验,将L3AM损失与25种先进的SOTA损失函数进行了比较,并将其应用于8SOTA手势认证模型上进行测试。实验结果表明,L3AM损失进一步提高了8个手势认证模型的性能,并优于25种损失函数

论文链接:https://link.springer.com/article/10.1007/s11263-024-02068-w

代码链接:https://github.com/SCUT-BIP-Lab/L3AM