导师简介
陆璐,教授、博士生导师、深圳鹏城国家实验室访问教授,从事异构算力加速与性能优化、软件质量可靠性保障、互联网用户行为分析等领域。申请发明专利30余项;发表SCI/EI学术论文50余篇;软件著作权30余项;承担国家基金,广东省,广州市重大科技专项及华为,字节跳动,南方电网,OPPO,银之杰等企业委托开发项目80余项,荣获“2024年华为技术最佳合作奖”,以第一完成人获广东省科技进步二等奖二项。
研究兴趣
1.AI算力基准评测方法与工具:AI算力基准测试主要用于评估和比较不同硬件和软件平台在执行AI任务时的性能。通过标准化测试评价手段,为智算中心硬件选择和系统优化提供评估选型依据。
2.异构计算平台性能优化及并行加速:针对异构尤其国产算力平台,GEMM优化和并行加速是提升性能的关键。通过算法优化和硬件特性的深度融合研究提高计算速度和处理效率。
3.HPL/HPL-AI异构算法加速与优化:HPL和HPL-AI是衡量高性能计算系统浮点计算能力的基准。在异构计算平台上,通过极致算法和并行调度策略优化,提升算法的执行速度和稳定性。
4.智能化软件质量可靠性保障:使用基于AI的软件评估优化方法通过自动化测试、缺陷预测和行为分析等技术手段,提升软件的可靠性和安全性。
课题组网站:
http://www2.scut.edu.cn/cs/2017/0629/c22284a328108/page.htm
项目简介
本课题组在异构算力并行加速与性能优化方向拟招收博士后1名。
1.人工智能基准评测与算子库研发技术研究。本项目旨在开发一套全面的人工智能基准评测工具和算子库,研究基于人工智能的异构计算平台硬件与软件协同优化策略,增强训推一体智算中心计算效率。
2.构建面向昇腾MLIR的表达能力。本研究针对昇腾芯片,基于开源MLIR生态构建算子抽象,覆盖计算、内存、同步等细节,实现算子层编译优化。推动算子编程的抽象化与自动融合,提升智能计算效率。
3.Cutlass模版库性能优化。在NPU上的算子开发面临诸多挑战,为满足不同应用场景需求,构成一个灵活且高性能的计算库,通过支持多数据类型的模板参数、统一的数据排布表示和自定义的tile粒度融合计算逻辑,简化了高性能算子的自定义开发。
硬件平台与算力资源
目前课题组有包括Atlas 800服务器(ARM鲲鹏处理器+Ascend昇腾国产化自研NPU芯片)、AMD 芯片的MI210、NVIDIA芯片的A800高性能服务器等计算资源。
招收对象需具备以下研究经历之一
1.基本条件:具有计算机或相关专业的博士学位,良好的编程基础,在国际一流期刊或会议发表过科研论文至少三篇以上;
2.满足以下条件优先考虑:
(1)具有基于Nvidia、AMD或国产算力平台进行GEMM优化及并行加速的开发或研究经验;
(2)从事人工智能及高性能计算(HPC)的典型应用、HPL或HPL-AI异构算法的加速与优化研究经验;
(3)具有项目申报和结题申请资料准备经验,有一定沟通交流能力。
应聘简历投递及联系方式
有意向者请投递个人简历(包括学习、工作和研究经历、荣誉奖励、发表论文等)和代表性研究成果至课题组联系人电子邮箱:lul@scut.edu.cn,邮件主题命名为:“应聘博士后-本人姓名-研究方向”。