近日,CVPR 2022官方公布了接收论文列表,必威韩军伟教授团队7篇论文入选,录用率接近60%。
CVPR全称IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition),该会议始于1983年,是计算机视觉和模式识别领域的顶级会议。近年来,会议平均录用率在25%左右,根据谷歌学术公布的2021年最新学术期刊和会议影响力排名,CVPR在所有学术刊物中位居第4,仅次于Nature,NEJM和Science。
韩军伟教授所带领的脑与人工智能研究团队共有教师13人,其中有1人当选IEEE Fellow,3人获国家级领军人才称号,2人获国家级青年人才称号,4人获得省部级人才称号,4人次入选2021年科睿唯安全球“高被引科学家”。近年来团队结合西工大“三航”特色,坚持“顶天、立地、育人”的价值取向,一方面面向国际科技前沿,开展脑科学领域的研究工作,另一方面面向国家重大需求,旨在提升视觉感知智能。团队在人才培养、国际前沿基础研究、关键技术突破等方面取得可喜成绩。
人才培养方面,2人入选博士后创新人才支持计划,1人获得全国百篇优秀博士学位论文提名奖,4人获得陕西省优秀博士学位论文奖,1人获得教育部博士研究生学术新人奖,2人获得中国图象图形学学会优秀博士论文奖,1人获得ACM CHINA SIGAI(国际计算机学会中国人工智能分会)优秀博士论文奖。
在国际前沿基础研究方面,积极开展原始创新研究,获得多媒体领域顶级国际期刊《IEEE电路系统视频技术汇刊》(IEEE Transactions on Circuits and Systems for Video Technology)2021年度最佳论文奖(Best Paper Award),获得2021年度IEEE地球科学与遥感学会最有影响力论文奖(IEEE GRSS Highest Impact Paper Award),获得国际会议IEEE BIBM 2018最佳论文奖,3篇论文入选2018年度、2019年度中国百篇最具影响国际学术论文。
在关键技术突破方面,紧密围绕国家/国防重大战略需求,在大规模感知系统目标检测、识别、跟踪等领域,取得了多项具有自主知识产权的核心技术,研究成果成功应用于智能手机、铁路视频监控、战区重大演习、高分辨率对地观测等领域。代表性成果获得了2017年教育部自然科学奖二等奖、2018年陕西省科学技术奖一等奖、2020年国防科技进步二等奖、2020年测绘科学技术一等奖、2021年吴文俊人工智能技术发明奖一等奖等科技奖励。
团队本次录用的7篇论文主要面向零样本、小样本、弱监督、自监督、对抗攻击等前沿且极具挑战的视觉智能问题,简要介绍如下:
[小样本语义分割新视角]
郎春博,程塨,屠斌飞,韩军伟. Learning What Not to Segment: A New Perspective on Few-Shot Segmentation, CVPR 2022.
当前小样本语义分割的研究大多通过元学习框架来实现泛化;然而,在这样的范式下训练的模型往往存在基类偏执,而非理想化的类别无关。为此,本文提出在小样本分割模型(元学习器)上引入一个分支(基学习器)来明确地识别基类的目标,即不需要分割的区域。然后,对两个学习器并行输出的粗结果进行自适应集成以得到精确的预测。更令人惊讶的是,我们的方案利用两个朴素的学习者获得了最优异的性能指标,并能够扩展至更具挑战性的广义设置。
[面向黑盒对抗攻击的代理训练框架]
孙绪祥,程塨,李虹达,裴蕾,韩军伟. Exploring Effective Data for Surrogate Training Towards Black-box Attack, CVPR 2022.
在无法获取目标模型的训练数据时,利用本地训练的代理模型完成对目标模型的攻击对于AI安全性来说兹事体大。本文深入探索了对于代理训练最为有效的数据所具备的类别特性——类间相似性及类内多样性,分析了基于合成数据的代理训练方法的潜在优势,进而构建了一个面向黑盒攻击算法的代理训练框架、展示了代理数据对于提升代理训练的潜在优势、设计了两个替代模型的优化目标函数,大大提升了代理模型的训练效率。
[基于样例查询机制的在线动作检测]
杨乐,韩军伟,张鼎文. Colar: Effective and Efficient Online Action Detection by Consulting Exemplars, CVPR 2022.
时序动作定位任务从漫长的视频中发现有意义的动作片段,并标注起止时间和动作类别,在视频中浓缩有效信息,从而服务于智慧监控、内容分析等视频理解任务。考虑到实际应用中,算法需要在线地处理视频流并及时准确地检测出视频中正在发生的动作,在线动作检测成为了一个新兴的研究方向。考虑到已有方法只考虑固定历史片段的信息且无法建模跨视频关系,本文提出样例查询机制:通过在历史片段中和动作类别级别构建有代表性的样例进行在线动作检测。相比已有方法,我们的方案运行速度更快,并取得更高地检测精度,为该领域日后的研究工作提供了简单有效的基准模型。
[基于增量跨视图互蒸馏学习机制的CT影像生成]
方超伟,王良,徐君,袁奕萱,张鼎文,韩军伟. Incremental Cross-view Mutual Distillation for Self-supervised Medical CT Synthesis, CVPR 2022.
高分辨率CT影像可以帮助医生及医疗AI系统进行精确的影像学分析与疾病诊断,然而由于人体结构的特点,轴向视角的CT影像很难获得足够高的片间分辨率。为此,本文构建了一种自监督的轴向视角CT切片生成方法,提出了增量跨视图互蒸馏学习机制,利用矢状面视角影像和冠状面视角影像的高分辨率先验构建其与轴向视角影像的一致性约束;通过联合迭代不同视角的影像插值过程,实现轴向视角影像片间分辨率的增量式提升,改善模型应对具有不同层厚的CT影像的鲁棒性。
[基于鲁棒区域特征生成的零样本目标检测]
黄培亮,韩军伟,程德,张鼎文. Robust Region Feature Synthesizer for Zero-Shot Object Detection, CVPR 2022.
零样本目标检旨在提升模型对训练阶段不可见目标类的检测能力。传统的零样本学习模型在该任务环境下难以为未见目标生成具有足够类内多样性的区域特征,亦或是牺牲掉部分未见目标与图像背景的可区分性。在本研究中,我们充分考虑到物体检测任务的独特性,提出利用训练图像所包含的丰富的前背景区域特征来同时保持未见目标特征的类内多样性和类间可区分性,首次实现了同时针对可见目标类和不可见目标类的统一目标检测模型,并提供了首个零样本遥感目标检测的benchmark。
[弱监督旋转不变目标检测]
冯晓绪,姚西文,程塨,韩军伟. Weakly Supervised Rotation-Invariant Aerial Object Detection Network, CVPR 2022.
目标旋转是弱监督目标检测中长期存在但仍未深入研究的难题之一。本文提出了一种旋转不变弱监督目标检测网络,通过渐进精炼的方式,鼓励不同的分支对具有不同旋转角度的同一实例做出一致的预测,首次在图像级标签下实现旋转不变学习。与此同时,该网络自然地将对象实例从稀疏空间投射到具有不同角度感知旋转的子空间。通过耦合不同的子空间以挖掘更多不同角度的目标实例,训练更加鲁棒的旋转不变目标检测网络。
[基于非目标知识信息学习的小样本语义分割]
刘源炜,刘念,曹清龙,姚西文,韩军伟,邵岭. Learning Non-target Knowledge for Few-shot Semantic Segmentation, CVPR 2022.
现有小样本语义分割研究仅侧重于有效地挖掘目标物体的信息。然而,对于背景和干扰物体等非目标区域中的模糊区域,目前的方法往往难以分辨。为此,本文提出在仅使用已知的目标物体标签的前提下,通过背景损失函数来指导类别无关的背景原型学习,从而实现对背景的挖掘排除。然后,我们进一步找到与当前查询图像相关的干扰物体信息并排除。此外,我们提出了一种原型对比学习算法,以提高模型区分目标对象与干扰物体的能力。
作者:张鼎文、姚西文、程塨
审核:王丽、许斌