深度强化学习学术讲座
南开大学
计算机学院

数据库与信息系统研究室

深度强化学习学术讲座

主讲人:张伟楠博士上海交通大学

:面向海量智能体系统的深度强化学习技术

:2018年9月17日 14:00

:计算机学院523会议室

讲座摘要:

近年来,机器学习的落地场景有两个发展方向,一是从预测到决策的范式拓展,另一个则是从单智能体到多智能体的场景推广。由此,面向多智能体系统的深度强化学习开始越来越受到学术界和工业界的关注。本次报告,讲者将从多智能体深度强化学习的几个落地任务切入,由此引入它的基本数学定义和几个经典解决方法。之后讲者将深入海量智能体场景下的不同场景,探讨在海量智能体的情况下,传统多智能体强化学习方法的不足,并深入介绍基于平均场理论的强化学习和基于因子分解模型的强化学习算法。最后,讲者将介绍MAgent,一个专为海量智能体场景提供模拟实验的平台,并展示上述算法在该平台上的初步实验效果。

主讲人简介:

张伟楠博士现于上海交通大学计算机系和约翰霍普克罗夫特研究中心担任助理教授,研究方向为深度强化学习、无监督学习及其在数据挖掘问题中的应用。他于2011年毕业于上海交通大学计算机系ACM班,于2016年获得英国伦敦大学计算机系博士学位,在国际一流的会议和期刊上发表50余篇论文,其中5次以第一作者身份在ACM国际数据科学会议KDD上发表;2016年获得由微软研究院评选的“全球SIGKDD Top 20科研新星”称号;2017年获得ACM国际信息检索会议SIGIR的最佳论文提名奖;2017年获得上海ACM新星奖。他曾在KDD-Cup用户个性化推荐大赛获得全球季军,在全球大数据实时竞价展示广告出价算法大赛获得最终冠军。此外他也曾在谷歌硅谷总部、微软剑桥研究院、微软亚洲研究院做人工智能和大数据挖掘方向的研究实习。

分享到: