报告题目: 视觉扩散模型的若干探索:从可控性、采样奇异性到安全漏洞
报 告 人: 谢晓华教授
报告时间:2025年10月9日15:00-16:00
报告地点:清清文理楼3A02
邀 请 人: 曾才斌教授
欢迎广大师生前往!
数学学院
2025年10月03日
报告人简介:
谢晓华,中山大学计算机学院教授、博士生导师,广东省信息安全技术重点实验室副主任,广东省科技青年拔尖人才。主持5项国家级科研项目(含重点项目1项)、3项省级项目(含重点项目1项)及多项省市重大任务;以骨干成员参与国家重大/重点项目5项。在包括IEEE TPAMI、IJCV、ACM Computing Surveys、IEEE TIP、IEEE TIFS、IEEE TVCG、ICML、NeurIPS、ICCV、CVPR在内的国际著名刊物和会议发表论文150篇(其中CCF-A/中科院一区论文85篇),单篇论文最高引用超过2000次,入选美国斯坦福大学和爱思唯尔2025年全球前2%顶尖科学家年度影响力榜单,拥有国家授权发明专利45件。核心技术支撑研发的嵌入式行人分析智能摄像机在十多个国家获得应用。获广东省自然科学一等奖、教育部自然科学二等奖、广东省自然科学二等奖、中国电子学会优秀硕士学位论文指导老师奖。
报告摘要:
本报告探讨当前最主流的视觉生成模型——扩散模型的生成改进与对抗安全。首先,在生成机制层面,基于最优传输理论为离散扩散过程定义离散概率流,提升了生成的确定性。其次,剖析反向扩散在采样时间端点的奇异性问题,提出有数学保证的正则化初始采样方法,有效缓解了图像生成的平均亮度问题。最后,在系统应用层面,揭示 IP-Adapter 等扩展模块的安全漏洞问题:攻击者可构造图像级对抗样本实现隐蔽的劫持式越狱。