关于举行中国科学院自动化研究所赵冬斌研究员学术报告会的通知
时间:  
2018-04-16 08:49:37
  来源:  
自动化科学与工程学院
  作者:  

报告人:中国科学院自动化研究所赵冬斌研究员、博士生导师

题目:深度强化学习算法及应用

时间:2018422日上午10:001200

地点:三号楼六楼会议室

摘要:

将具有决策能力的强化学习(RL:Reinforcement Learning)和具有感知能力的深度学习(DL:Deep Learning)相结合,形成深度强化学习(DRL:Deep RL)方法,成为人工智能(AI:Artificial Intelligence)的主要方法之一。2013年,谷歌DeepMind团队提出了一类DRL方法,在视频游戏上的效果接近或超过人类游戏玩家,成果发表在2015年的《Nature》上。2016年,相继发表了所开发的基于DRL的围棋算法AlphaGo,以5:0战胜了欧洲围棋冠军和超一流围棋选手李世石,使围棋AI水平达到了一个前所未有的高度。2017年初,AlphaGo的升级程序Master,与60名人类顶级围棋选手比赛获得不败的战绩。201710月,DeepMind团队提出了AlphaGo Zero,完全不用人类围棋棋谱而完胜最高水平的AlphaGo,再次刷新了人们的认识。并进一步形成通用的AlphaZero算法,超过最顶级的国际象棋和日本将棋AIDRL在视频游戏、棋类博弈、自动驾驶、医疗等领域的应用日益增多。本报告将介绍强化学习、深度学习和深度强化学习算法,以及在各个领域的典型应用。

报告人简历:

赵冬斌,中国科学院自动化研究所,研究员、博士、博士生导师,中国科学院大学岗位教授。任IEEE计算智能学会北京分会主席,曾任自适应动态规划和强化学习技术委员会主席、多媒体委员会主席等。IEEE高级会员、自动化学会高级会员等。任领域顶级期刊IEEE TNNLSIEEETCyb, IEEE CIM编委等,国际期刊特邀编辑10余次,包括作为首席客座编委组织2018IEEE TNNLS深度强化学习和自适应动态规划专刊,2019IEEETCIAIG深度强化学习和游戏专刊。多次在权威国际会议上担任要职。发表论文300余篇,授权发明专利30项、国际发明专利1项。目前主要研究方向为深度强化学习、计算智能、自适应动态规划方法及在游戏、智能车、机器人、医疗、能源等领域的应用。

  

欢迎各位从事人工智能理论与应用研究的教师和学生踊跃参加!