上海交通大学张伟楠博士来南开大学计算机学院进行学术讲座

2018年9月17日星期一下午14:00，上海交通大学博士张伟楠博士来我院进行题目为“面向海量智能体系统的深度强化学习技术”的学术讲座。讲座由南开大学计算机学院承办，南开大学计算机学院张莹副教授参加并主持了讲座。来自南开大学计算机学院、网络空间安全学院等学院的师生共同聆听了讲座。

张伟楠博士首先介绍了两种种类的机器学习，一种是像常见的监督学习和非监督学习那样做出预测，另一种是取决于动态环境基于独特的状态从交互中学习进而做决定，点出强化学习，紧接着介绍了什么是强化学习。接下来介绍了马尔可夫决策过程，它为情景中的决策建模提供了一个数学框架，并且正式地为强化学习描述了一个环境。

接下来张伟楠博士详细地介绍了马尔可夫决策过程的数学原理以及其目标，同时还举了个生动形象的走迷宫的例子为我们阐述了这一原理，接下来又介绍了Q-Learning以及Deep Q-Network。张伟楠博士接下来介绍了一些随机游戏以及多个智能体情况下的Q-Learning。介绍了当智能体增多时会产生的问题，同时给出了一些解决这些问题的想法，最后以多组实验来说明其正确性。

本次讲座既包含前沿的科学知识，又涵盖一些基本概念以及用很多动画生动地进行了描述，整个过程妙趣横生，引人思索，在讲座的最后阶段参与讲座的老师和同学们积极提问，并表示收获颇多。最后，我们向本次讲座的主讲人张伟楠博士表达由衷的感谢。

数据库与信息系统研究室

DBIS2023级研究生报名

上海交通大学张伟楠博士来南开大学计算机学院进行学术讲座

分享到：