【我院南山青年学术论坛】学术报告通知（第六十一讲）

2021年11月10日 11:19 点击：次

报告题目：细粒度视觉分类与检索

报告人：彭宇新

主持人：赵世杰

报告时间：2021年11月11日（周四）晚上19:00

报告地点：腾讯会议ID：127 470 024

报告简介：

与一般的视觉分类不同，细粒度视觉分类旨在对粗粒度的大类（如鸟、车等）进行细粒度的子类划分（如大冠蝇霸鹟、阿卡迪亚霸鹟、蓝鹀等鸟类子类别；奥迪A6、A8等车类子类别），其挑战在于外形、颜色等相似导致的不同类别差异小，姿态、视角等不同导致的相同类别差异大。如何借鉴人脑的认知机理，模拟视觉注意力机制学习多粒度的辨识性特征，突破细粒度视觉分类难题，对于提高计算机的感知和认知能力至关重要。本报告将介绍我们在细粒度视觉分类上的相关研究进展，包括空间拓扑注意力学习、堆叠式深度强化学习、层次化深度增量迁移学习等方法，以及我们在细粒度跨媒体检索上的探索，实现了由图像、视频到跨媒体的扩展，由分类到检索的扩展。

报告人简历：

彭宇新，北京大学二级教授、博士生导师、国家杰出青年科学基金获得者、国家级高层次人才计划入选者、中国人工智能产业创新联盟专家委员会主任、中国工程院“人工智能2.0”规划专家委员会专家、北京图象图形学学会副理事长、中国图象图形学学会副秘书长。主要研究方向为跨媒体分析与推理、图像视频识别与理解、计算机视觉、人工智能。以第一完成人获2016年北京市技术发明一等奖和2020年中国电子学会科技进步一等奖，2008年获北京大学宝钢奖教金优秀奖，2017年获北京大学教学优秀奖。主持了863、国家自然科学基金等20多个项目，发表论文160多篇，包括ACM/IEEE Trans和CCF A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛，均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TCSVT等期刊编委。

撰稿：赵世杰

审核：王小旭

上一条：翱翔灵犀学术殿堂之刘兴华教授报告会通知下一条：【我院南山青年学术论坛】学术报告通知（第六十讲）

必威

学院概况

师资队伍

人才培养

科学研究

党群工作

学生工作

国际合作

校友之家

人才招聘

院务公开

必威

【我院南山青年学术论坛】学术报告通知（第六十一讲）