我校成功举办中国图象图形学学会广州会员活动中心及广东省图象图形学会2023年联合学术交流报告会

发布者:吴春风发布时间:2023-03-23浏览次数:531


广东省图象图形学会(GDSIG)第七届会员代表大会暨中国图象图形学学会(CSIG)广州会员活动中心成立大会于2023312日在我校成功召开。会议期间,CSIGGDSIG联合举办了2023年学术交流报告会。 本次学术报告会由CSIG广州会员活动中心、GDSIG和华南理工大学电子与信息学院联合主办,由华南理工大学电子与信息学院、CSIG广州会员活动中心联合承办。报告会吸引了图象图形专家学者150多人参加,反响热烈。

来自香港浸会大学的阮邦志教授,哈尔滨工业大学计算学部长聘教授、哈工大人工智能研究院副院长、教育部青年长江学者车万翔教授,华中科技大学王兴刚教授(国家青年人才计划入选者)等专家学者在大会上做学术报告。

阮邦志教授在题为“Remote Photoplethysmography Based 3D Facial Mask Presentation Attack Detection (a.k.a Face Anti-spoofing)的学术报告中,详细介绍了基于远程光脑成像的3D人脸面具攻击检测方法。虽然人脸识别技术已经被广泛部署在许多实际应用中,但关于人脸呈现攻击检测(PAD)的研究问题仍未解决。流行的人脸呈现攻击包括图像、视频和三维面具。在这些攻击中,三维面具攻击是最具挑战性的,因为高质量的三维面具可以以合理的成本创建。解决三维面具呈现攻击的一个很有前途的方法是远程光脑成像(rPPG)。报告讨论了使用rPPG技术进行面部PAD的基本原理,以及基于rPPG的面部PAD方法。考虑到基于rPPG的人脸PAD方法的可靠性依赖于估计rPPG信号的质量,报告还讨论了rPPG估计算法的稳健性。

车万翔教授专题讨论“ChatGPT这一世界最新科学技术2022121日,OpenAI推了全新一代的对话式人工智能工具——ChatGPT, 车教授报告浅析了ChatGPT究竟解决了什么科学问题,是如何解决该问题的,以及未来会还有哪些亟待解决的问题。

王兴刚教授在题为“联合掩码图像建模和对比学习的大规模预训练视觉基础模型研究”的学术报告中指出,以CLIP为代表的大规模预训练视觉基础模型将是未来计算机视觉发展的重要组件,为获取更好的预训练视觉基础模型,他们从掩码图像建模(MIM)和对比学习(CL)相结合的思路出发,做出了两方面的研究探讨,均录用于CVPR 2023。第一个工作提出了一种新颖的在语言语义空间进行掩码重建 (RILS)的 预训练框架,RILS能够实现文本编码器和视觉编码器的协同增益,在同一个网络中融合CLIPMIM二者的优点,在下游分类、检测和分割方面表现出优秀的可转移性。第二个工作提出了一个名叫EVA的视觉基础模型用以探索大规模视觉表征的极限,可以有效地将 EVA 扩展到 10 亿个参数,并在图像识别、视频动作识别、目标检测、实例分割和语义分割等广泛的具有代表性的视觉下游任务上创造新记录,而无需大量监督训练。 此外,EVA很大程度上解决了开放场景大类别实例分割问题,在1000类的LVIS数据集上取得了和80COCO数据集几乎相同的业内领先性能。他们推出EVA-CLIP,一个能够稳定高效训练且性能卓越的开源CLIP模型,且已经被Salesforce等公司使用。


专家教授各自研究领域,世界最新科技热点深入探讨交流,为与会专家学者带来了一场学术盛宴。(/薛洋,图/姚映雪)



TOP