华南理工大学大数据与智能机器人教育部重点实验室实验室承办APWeb-WAIM2021国际学术会议获得圆满成功

发布者:杨迪宇发布时间:2021-11-04浏览次数:934

       近日202182325日,由APWeb-WAIM指导委员会(APWeb-WAIMSteeringCommittee)主办,华南理工大学软件学院、大数据与智能机器人教育部重点实验室承办的第五届国际亚太互联网-网络时代信息管理和大数据联合会议(APWeb-WAIM2021)在腾讯会议线上举行。华南理工大学的蔡毅教授、澳大利亚国立大学的TomGedeon 教授、香港理工大学的李青教授以及马德里康普斯顿大学的BaltasarFernándezManjón教授担任本次会议的主席。来自中国、美国、加拿大、新加坡、澳大利亚、法国、日本等国家和地区的100余名专家学者和研究人员参加了本届会议,共同探讨万维网和大数据最新研究进展、行业应用及未来发展。

华南理工大学软件学院院长王振宇教授在开幕式上致辞。他介绍了广州和华南理工大学软件学院的基本情况,对参会的各位专家和代表表示热烈欢迎。APWeb-WAIM指导委员会主席、澳大利亚维多利亚大学张彦春教授发言,希望各位专家学者共同努力,推进大数据和网络信息管理研究和应用深入发展,期待本次会议成为专家学者们增进了解、加强合作和激发创新思维的盛会。会议程序委员会联合主席、澳门大学LeongHou U教授介绍了本届会议的征稿和录取情况。

会议共安排了4个主题报告(keynote),分别邀请了加拿大滑铁卢大学的M.Tamer Özsu教授、中国复旦大学的王晓阳(X.Sean Wang)教授、美国亚利桑那州立大学的刘欢(HuanLiu)教授以及新加坡国立大学的萧小奎(XiaokuiXiao)教授作为主题报告的主讲人,报告内容涉及了分布式RDF数据管理和SPARQL处理方法、在数据科学中努力实现对社会负责的人工智能、使完整的数据分析软件堆栈民主化、大型图的高效网络嵌入等方面的最新研究成果。

来自加拿大滑铁卢大学的M.Tamer Özsu教授所作的报告主题为:分布式RDF数据管理和SPARQL处理方法。在早期,人们就已经提出了将资源描述框架(RDF)作为开发“语义网”的一部分以对Web对象进行建模的想法,但其用途不断延伸,远远超出了最初的目标。随着RDF数据量的增加,常见的可扩展性问题也随之出现,为了缓解在大型RDF数据集上的SPARQL查询的分布式/并行处理的问题,已经开发出了相关的解决方案。在本次报告中,M.Tamer Özsu教授首先给参会者们简单介绍了PDF和集中式系统,然后再着重阐述扩展系统和联合系统,通过这样的方式重点阐述了RDF数据管理和SPARQL处理方法这两个领域的内容。

来自中国复旦大学的王晓阳(X.SeanWang)教授所作的报告主题为:使完整的数据分析软件堆栈民主化。数据分析和机器学习是一项复杂的任务,涉及一整套硬件和软件系统,它可以从常规的计算系统、云计算和超级计算系统,到数据收集系统、数据存储和数据库系统、数据挖掘和机器学习系统,以及数据可视化和交互系统。王晓阳(X.SeanWang)教授指出,一个现实的、高效的数据分析和人工智能应用往往需要不同系统之间的顺畅协作,但这是一个巨大的技术障碍,尤其是对非计算机专业人士而言。数据分析和机器学习的民主化进程已经开始在各个方面出现,但仍需要在人机自然交互、系统自动选择和部署、工作流自动执行和优化等多个方向进行研究和开发。可以预见,想要使得这一民主化进程继续下去,计算机科学家的研究和开发工作不可或缺。

来自美国亚利桑那州立大学的刘欢(HuanLiu)教授所作的报告主题为:在数据科学中努力对社会负责的人工智能。人工智能变得越来越普遍和高效,它广泛应用于新闻摘要、购物推荐、雇员和解雇等决定以及政治竞选等方面,而数据可以增强人工智能算法的能力,然后再次对其收集以用于进一步训练人工智能算法。在这过程中,人们开始逐渐意识到人工智能的算法存在偏差,这些偏差可能会带来负面的影响。面对这些挑战,刘欢(HuanLiu)教授在会议报告上探讨了人工智能在数据科学领域的社会责任:什么是人工智能?它为什么重要?它如何保护和通知我们并帮助防止或减轻人工智能的滥用?会议上通过隐私保护、网络欺凌识别和虚假信息检测的用例展示了具有社会责任感的人工智能是如何工作的,并且在了解了人工智能的问题和人们相互冲突的目标后,进一步讨论了在追求具有社会责任感的人工智能时的一些困境和挑战。

来自新加坡国立大学的萧小奎(XiaokuiXiao)教授所作的报告主题为:大型图的高效网络嵌入。现有的网络嵌入方法大多无法扩展到包含数百万个节点的大型图,这主要是因为产生的计算成本过大或在此类图上生成的嵌入的质量不高。在本次报告中,萧小奎(XiaokuiXiao)教授针提出两种有效的网络嵌入算法,分别适用于有节点属性和无节点属性的大型图。其基本思想是首先基于随机游走对节点之间(或节点与属性之间)的亲和度进行建模,然后对亲和度矩阵进行分解以导出嵌入。在这当中,解决的主要挑战包括亲和度度量的选择以及减少亲和度矩阵的构建和分解所带来的空间和时间开销。在大型图上的大量实验表明,这两种算法在嵌入质量和效率方面都优于现有方法。

会议还安排了1个教程(tutorial),由来自哈尔滨工业大学的王宏志教授和丁晓欧博士讲授教程,主题为:工业大数据清洗。现如今人们意识到工业数据是一种宝贵的无形资产。但是,工业现场采集的数据面临着各种质量问题,工业应用迫切需要实用的数据清洗技术。在本次教程中,先是由王宏志教授提出工业数据中的检测异常类型和特点,然后由丁晓欧博士对数据修复的最新方式及其优缺点进行讲解。该教程的内容引起学者们的巨大兴趣及热烈讨论。

本届APWeb-WAIM2021会议还包含3个专题研讨会(workshop),研讨会主题分别为知识图谱管理与应用、半结构化大数据管理与应用以及大规模非结构化数据分析中的深度学习,参会代表与论坛论文讲者就这些热点问题进行了热烈的讨论。

第四届知识图谱管理与应用国际研讨会(KGMA2021)旨在汇集来自知识图谱研究与应用、图数据库、社交网络等相关社区的研究人员、从业人员、开发人员和用户,共同探讨目前知识图谱的可用性问题以及未来知识图谱在不同领域的研究方向。

第三届半结构化大数据管理与应用国际研讨会(SemiBDMA2021)旨在提供一个专门的论坛,将研究人员、从业者和其他人聚集在一起,分享和交流关于半结构化大数据管理和应用的想法、实践开发经验和最新研究成果。SemiBDMA2021将为来自学术界和工业界的研究人员以及从业者提供一个绝佳的机会,展示该领域的最新进展,并讨论半结构化大数据管理和应用的未来研究方向和挑战。研讨会的范围包括信息技术的所有重要方面,包括半结构化大数据的存储、查询处理、分析和质量,特别是在领域的应用。

第二届深度学习与大规模非结构化数据分析国际研讨会(DeepLUDA2021)重点是深度学习CycleGAN模型在医学图像分割中如何进行生成数据增强,了解一种半监督多模态对比互学习方法解决医学图像分割中不完整注释的问题,深刻讨论新的深度医学图像分割框架的研究方向及存在的困难。

本届APWeb-WAIM2021会议共征集论文184篇,经专家评审,68篇研究论文(其中长文44篇、短文24篇,长文录用率为23.91%)和6篇演示论文被录用,由Springer出版社出版会议论文集。会议论文汇报有13个分组(researchsession)和1组系统演示(demosession),主题涵盖内容广泛,例如图形挖掘、数据挖掘、数据管理、主题模型和语言模型学习、文本分析、文本分类、机器学习、知识图谱、新兴数据处理技术、信息提取和检索、推荐系统以及空间和时空数据库等主题。

经组委会评审,本次会议共评出1篇最佳论文、1篇最佳论文亚军、1篇最佳学生论文、1篇最佳学生论文亚军和1篇最佳演示论文。

APWebWAIM分别是“亚太Web会议”和“Web时代信息管理会议”的简称,均属于中国计算机学会CCFC类推荐会议,在数据库相关领域国际同行中具有较好口碑。自2017起这两个国际会议在一起联合召开,目的是打造顶级会议平台。第一届APWeb-WAIM2017年在北京召开,第二届APWeb-WAIM2018年在中国澳门召开,第三届APWeb-WAIM2019年在成都召开,第四届APWeb-WAIM2020年在天津线上召开。APWeb-WAIM会议及相关研讨会的论文集将由国际学术出版商斯普林格(Springer)作为计算机科学讲义(LNCS)系列出版。



相关链接

APWeb-WAIM2021会议链接

APWeb-WAIM2021会议论文集https://link.springer.com/book/10.1007/978-3-030-85896-4

                                                     https://link.springer.com/book/10.1007/978-3-030-85899-5



文:杨迪宇