人工智能学院李蒙阳博士在深度学习模型行为分析的研究中取得重要进展,提出一种基于深度训练动态表示的图像分类优化新方法,显著提升了模型在噪声标签与类别不平衡场景下的鲁棒性与准确性。相关研究成果以“Delving Into the Training Dynamics for Image Classification”为题,发表于《IEEE Transactions on Image Processing》。

该研究首次系统性地从200个图像分类任务中提取142维训练动态特征,构建出通用训练动态表示模型TD2Vec,并基于此提出两项创新应用:通用噪声标签检测器(GNLD)与不平衡学习算法MWN-DRTS。GNLD可实现训练早期的在线噪声识别,MWN-DRTS则通过动态样本加权有效缓解长尾分布问题。实验结果表明,GNLD在CIFAR-10、ImageNet-1k、Clothing1M等多个数据集上均取得业界领先的F1分数;MWN-DRTS在长尾识别任务中平均提升准确率2%以上。该方法已成功扩展至目标检测任务,在MS COCO数据集上实现2.4 mAP的性能提升。
本研究由天津大学、天津师范大学、北京大学、中国科学院大学合作完成,李蒙阳博士为论文第一作者。研究为训练过程的可解释性与智能化提供了新思路,具有重要的理论价值与应用前景。
论文地址:https://ieeexplore.ieee.org/document/11202341