报告题目: Stochastic Augmented Lagrangian Method For Reinforcement Learning
报 告 人:文再文 教授(北京大学)
报告时间:2021年 10月 13 日(星期三)20:00-21:00
报告地点:腾讯会议号:284 865 535 会议密码:211013
https://meeting.tencent.com/dm/l3TcsokEI6RE
邀 请 人: 潘少华 教授
欢迎广大师生参加!
数学学院
2021年10月11日
报告摘要:Recently, reinforcement learning (RL) has been a very important tool for artificial intelligence. We consider the linear programming formulation of RL and design a stochastic augmented Lagrangian method for overcoming the double sampling obstacles. Preliminary experiments illustrate that our method is competitive to other state-of-the-art algorithms.
报告人介绍:文再文,北京大学北京国际数学研究中心教授,主要研究最优化算法与理论及其在机器学习、人工智能和信号处理中的应用。2016年获中国青年科技奖。现为中国运筹学会常务理事,中国运筹学会数学规划分会副理事长。