姓名:陆璐
职称 / 职务:教授
主要研究领域:异构算力并行加速与性能优化、软件测试与可靠性保障、软件架构设计与优化
所在团队:网络空间安全与软件可靠性保障
办公邮箱:lul@scut.edu.cn
办公室电话:13802918651
个人简介:
陆璐,中国计算机学会软件工程专委会委员,华南理工大学计算机科学与工程学院教授,博士生导师,主要从事异构算力并行加速与性能优化、软件测试与可靠性保障、软件架构设计与优化等领域的科研工作。已发表三大索引论文五十余篇,申请及授权专利、软件著作权二十余项,承担国家重点研发计划,国家自然科学基金,广东省,广州市重大科技专项及企业委托开发项目80余项。以第一完成人获华为技术最佳合作奖,广东省科技进步二等奖二项,广东省科技进步三等奖一项,广东省计算机学会二等奖一项,华为昇腾MVP。
教育经历:
1997-1999,西安交通大学,博士
2000-2001,香港城市大学,博士后
工作经历:
2001-2003,东方汇理(香港)银行,高级系统分析师
2003-目前, 华南理工大学计算机科学与工程学院
课程教学:
Ø 软件测试与质量控制
Ø 数据结构
Ø 软件架构设计
科研项目:
1. 2023年服务器RAID卡项目,工业与信息化部重点攻关项目,2023-2026,在研;
2. 昇腾模版库及AscendNPU IR性能优化合作,华为委托项目,2024-2026,在研;
3. ACTLASS合作项目,字节跳动委托项目,2024-2026,在研;
4. 构建面向昇腾MLIR表达能力,华为委托项目,2024-2026,在研;
5. 面向大语言模型的GEMM优化算法研究,广东省自然基金面上项目,2023-2026,在研;
6. 智能识别、数据分析处理及金融业务模型相关软件开发,银之杰联合实验室委托项目,2023-2025;结题;
7. 昇腾性能增强库技术合作,华为委托项目,2022-2023,结题;
8. Blas库性能优化 ,华为委托项目,2022-2023,结题;
9. 毕昇编译器不规则表达计算场景优化,华为委托项目,2022-2023,结题;
代表性成果:
l 代表性论文成果
1. Zhang, Yu, Lu Lu, Zhanyu Yang, Zhihong Liang, and Siliang Suo. A load-balanced acceleration method for small and irregular batch matrix multiplication on GPU. Journal of Systems Architecture 160 (2025): 103341.
2. Zhang, Yu, Lu Lu, Zhanyu Yang, Zhihong Liang, and Siliang Suo. LE-GEMM: A lightweight emulation-based GEMM with precision refinement on GPU. Journal of Systems Architecture 160 (2025): 103336.
3. Yang, Zhanyu, Lu Lu, and Quanyi Zou. Ensemble Kernel-Mapping-Based Ranking Support Vector Machine for Software Defect Prediction. IEEE Transactions on Reliability (2024).
4. Guo, Yijie, Lu Lu, and Songxiang Zhu. Novel accelerated methods for convolution neural network with matrix core. The Journal of Supercomputing 79, no. 17 (2023): 19547-19573.
5. Wang, Ruimin, Zhiwei Yang, Hao Xu, and Lu Lu. A high-performance batched matrix multiplication framework for gpus under unbalanced input distribution. The Journal of Supercomputing 78, no. 2 (2022): 1741-1758.
6. Yang, Zhiwei, Lu Lu, and Ruimin Wang. A batched GEMM optimization framework for deep learning. The Journal of Supercomputing 78, no. 11 (2022): 13393-13408.
7. Hu, Yichang, Lu Lu, and Cuixu Li. Memory-accelerated parallel method for multidimensional fast fourier implementation on GPU. The Journal of Supercomputing 78, no. 16 (2022): 18189-18208.
l 团队成果转化情况
1. HPL-GPU:优化了基于AMD平台的HPL版本,将HPL整体性能提高了20%,贡献3万+的源代码(https://github.com/reger-men/HPL_GPU/graphs/contributors)。
2. 帮助鹏城实验室开发了单节点连续多核多任务加速算子,从初始244TFlops计算效率提升至315TFlops, 整体性能提升达到了29%。
3. 华为昇腾平台模板库和长文本序列项目开源(https://gitee.com/ascend/catlass && https://gitee.com/ascend/cann-var-sequence-gemm)。
4. 开发的互联网数据采集与用户行为分析平台已经在伊莱特、美味鲜、克劳迪等20家企业及软件开发个人与行业用户进行成功应用(http://www.i-test.com.cn)。
获奖荣誉:
l 2024/2025年获得华为技术最佳合作奖
l 2019年获得广东省科技进步二等奖
l 2016年获得广东省科技进步三等奖
l 2012年获得广东省计算机学会二等奖
l 2010年获得广东省科技进步二等奖