近日,哈尔滨工程大学信息与通信工程学院教师项学智作为第一作者,在世界著名的人工智能顶级学术期刊《IEEE模式分析与机器智能汇刊》(《IEEE Transactions on Pattern Analysis and Machine Intelligence》)上发表学术论文“深度场景流学习:从2D图像到3D点云”(“Deep Scene Flow Learning: From 2D Images to 3D Point Clouds”, IEEE-T-PAMI, DOI: 10.1109/TPAMI.2023.3319448)。
场景流(Scene Flow)是 3 维空间中的稠密运动场,以场景表面点在世界坐标系或摄像机坐标系下的 3 维位移矢量表示,其建立了3 维结构的时域关联,能够反映物体在3维空间中的真实运动。场景流在自动驾驶、立体视频编解码、3维场景重建、人体动作识别、高端视频监控等领域具有广泛的应用前景。哈尔滨工程大学项学智等人针对深度学习场景流估计开展了深入研究,提出了从2D图像到3D点云的场景流计算分类框架,并在此基础上对现有挑战和模型架构进行了梳理,比较了现有模型间的性能与效率,并对未来发展趋势进行了展望。
稠密运动估计原理图
IEEE TPAMI是计算机视觉、模式识别和人工智能领域公认的顶级国际期刊,是中国计算机学会(CCF)推荐的A类期刊,在中国计算机学会认定的人工智能领域四个A类期刊中排名第一,2023年最新影响因子23.6。根据Google Scholar Citation统计,IEEE TPAMI在所有计算机工程、电子工程及人工智能相关期刊榜单上以165分的h5-index排在第1位,主要收录人工智能、模式识别、计算机视觉及机器学习领域的原创性科研成果。TPAMI筛选极其严格,每年录用量仅200篇左右。
项学智,男,1979 年 11 月生人,工学博士,副教授,博士生导师。IEEE 会员,ACM 会员,中国计算机学会(CCF)高级会员。加拿大渥太华大学 (University of Ottawa) 访问学者,哈尔滨工业大学仪器科学与技术流动站博士后,研究领域包括计算机视觉、模式识别与机器学习、深度学习等。近年在 IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI, IF=23.6)、IEEE Transaction on Image Processing(TIP, IF=11.041)、IEEE Transactions on Circuits and Systems for Video Technology(TCSVT, IF=8.4)、Pattern Recognition(PR, IF=8.518)、Neurocomputing(NC, IF=6.0)等国际知名 Top期刊上,以及 ICIP、ICASSP 等知名国际会议上发表学术论文 50 余篇,出版学术专著 1 部,曾先后主持或参与国家重点研发计划1项、国家自然科学基金4项、黑龙江省自然科学基金项目3项、黑龙江省博士后基金1项、中央高校基础研究基金5项、哈尔滨市科技创新人才基金1项,并作为项目负责人或技术负责人承担与科研院所及企业的横向联合项目10余项;申请国家发明专利20余项,转化1项,软件著作权8项;曾获哈尔滨工程大学优秀青年主讲教师荣誉称号、校优秀主讲教师三等奖。指导博士生获黑龙江省人工智能学会优秀博士论文及哈尔滨工程大学优秀博士论文奖,指导留学生博士获哈尔滨工程大学优秀毕业生荣誉称号。2014年6月创立了“机器视觉与智能控制联合实验室”,加盟单位包括加拿大渥太华大学多媒体计算实验室、天津通信广播集团数字实验室、哈尔滨天源石化工程设计有限责任公司等单位,团队于 2018 年被选为黑龙江省人工智能产业创新团队,并被列入黑龙江省人工智能产业三年专项行动计划,2020 年参与建设并获批“多学科协同认知人工智能技术与应用黑龙江省重点实验室”。