河北大学网络空间安全与计算机学院智能感知与人机交互团队彭锦佳(教师)、刘俊宇(学生)的最新研究成果“Bi-level Inter-modality Modulation for Unsupervised Visible-Infrared Person Re-Identification”被计算机安全领域顶级学术期刊IEEE Transactions on Information Forensics and Security(2026 CCF A)录用发表。这是河北大学作为第一署名单位在无监督跨模态行人重识别领域取得的重要科研成果,对于提升我校人工智能、信息安全学科的学术影响力与学科竞争力具有重要作用。
研究团队长期致力于计算机视觉领域跨模态行人重识别方向的研究,聚焦无监督可见光-红外行人重识别的核心难题展开深入探索。无监督可见光-红外行人重识别任务的核心挑战在于解决模态偏差带来的跨模态语义对齐问题,而现有方法在伪标签生成过程中过度依赖单模态信息,未充分挖掘跨模态关联信息,难以有效弥合可见光与红外图像之间的模态鸿沟。针对上述关键问题,团队提出了用于无监督红外-可见光重识别任务的双级跨模态调制网络。首先,通过构建GrayMix中间模态,有效增强模型对颜色变化的鲁棒性,大幅缩小可见光与红外图像间的模态差距。并且设计了三元组校准融合模块,精准过滤跨模态聚类匹配中的噪声信息,构建混合模态聚类,建立可见光与红外模态间的共享语义空间。此外,提出了跨模态邻域一致性聚类方法,通过筛选高置信度跨模态邻域对并精细化特征距离,有效促进跨模态聚类的形成与传播。
该课题组已在跨模态行人重识别、图像修复、联邦学习等人工智能和信息安全核心领域取得了一系列重要研究成果,相关工作先后发表在CVPR、TIFS、ICCV、TMM、ACM MM等国际权威学术期刊和会议上。
以上工作得到了国家自然科学基金、河北省自然科学基金、石家庄市驻冀高校基础研究项目等项目的联合资助。
论文链接:https://ieeexplore.ieee.org/document/11422041
(网络空间安全与计算机学院、科学与技术创新研究院 供稿)