2024年10月17日上午,全省科技创新大会在广州召开,大会颁发了2023年度广东省科学技术奖。我院徐向民教授完成的成果“基于认知机理与物理规律的视觉认知计算理论与方法” (完成人: 徐向民、贾奎、丁长兴、蔡博仑、郭锴凌、王伟凝、青春美、张亚斌) 获得广东省自然科学一等奖。
项目简介:
为满足高质量发展与现代化生活的视觉数据高效使用需求,视觉处理需解决高质量图像增强、海量数据快速计算、复杂场景视觉分析等问题。但由于复杂模型的参数空间大、大数据带来大计算量、精准感知能力不如人脑,视觉数据的高效率处理挑战巨大。考虑到物理规律约束可减少优化求解空间,以及人脑的高效率处理数据方式,该项目基于认知机理与物理规律,聚焦视觉计算表征理论、建模方法及核心应用,取得系列重要发现:1)成像物理规律约束下的底层图像恢复:针对自然环境导致成像质量褪化的问题,将成像物理规律与数据统计规律相结合,构建端到端的深度学习图像增强模型;2)低复杂度机理约束下的中层特征计算:针对图像中层特征结构受分布不一致、复杂噪声干扰的问题,利用几何结构性与低秩稀疏性,建立图像中层特征结构模型;3)多通路认知机理约束下的高层语义感知:针对视觉数据内容复杂的问题,模拟整体与局部特征联合感知、多通路视觉进行语义感知。5篇代表性论文均发表在本学科国内外权威期刊,获他引1907次,受顶级学者广泛引用与高度评价。成果在部分行业龙头公司进行示范应用,助力智能化进程的有效推进。
成像物理规律约束下的底层图像恢复
多通路认知机理约束下的高层语义感知
文图/郭锴凌、初审/燕维英、复审/曾抒姝、终审/张健