5月31日,应山东师范大学信息科学与工程学院邀请,美国卡内基梅隆大学博士后常晓军在长清湖校区学院楼506会议室做了题目为《Complex Event Detection using Semantic Saliency and Nearly-Isotonic SVM》的学术报告。学院老师孙建德教授主持了本次会议,学院院长张化祥教授、部分老师、博士、硕士研究生聆听了此次报告。
报告会中,常晓军博士首先从当今世界海量的视频数据出发,就如何存储、分类、检索和识别视频数据来展开演讲。常晓军博士介绍,当只有有限的硬件资源可用时,我们提出了用于大规模视频数据集上的事件检测的辨别视频表示。有效利用深层卷积神经网络(CNN)来推进事件检测,现有CNN工具包提取帧级静态描述符。他们对CNN视频表示的推论作出了两个贡献。首先,虽然平均池和最大池化长期以来一直是聚合帧级静态特征的标准方法,但我们可以看出,通过利用适当的编码方法可以显着提高性能。第二,提出使用一组潜在的概念描述符作为帧描述符,这丰富了视觉信息。
报告会互动问答环节,常晓军博士不仅认真回答了老师同学们提出的视觉内容理解系统的各种问题,并对同学们的科研和研究生阶段规划提出了经验指导,与老师和同学们分享了不同条件和样本下实验的技巧和经验。整场报告会脉络清晰,内容详实,气氛轻松,使我院师生对视觉内容理解系统领域应用与现状有了更深的认识,拓展了广大师生研究视野,使大家受益匪浅。
常晓军博士,美国卡内基梅隆大学博士后。2016年于悉尼科技大学获得博士学位,曾在甲骨文、IBM等从事研发工作,负责开发了阿拉丁多媒体事件检测系统、视觉内容理解系统、深度跨模视频分析系统等。发表CCFA类文章20余篇,担任IJCAI、ACM MM、CVPR、NIPS等国际顶级会议的技术委员会委员,担任IEEE T-PAMI等国际顶级期刊的审稿人。
编辑:陈佳惠
审核:崔翠翠
Copyright 山东师范大学 党委研究生工作部