强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线
〖课程介绍〗:
强化学习,被誉为可能通向强人工智能的第三类机器学习方法,在AI游戏领域的应用已司空见惯,如自动玩flappy bird,借助强化学习玩星际争霸,最近非常火的王者荣耀也不例外;在无人驾驶、自动交易等领域也有着举足轻重的作用。
《强化学习》课程,带你揭秘AlphaGo和星际争霸/王者荣耀,华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。
〖课程目录〗:
第1课 强化学习RL简介
知识点1: 强化学习定义:可能通向强人工智能的第三类机器学习方法
知识点2: 强化学习数学模型:马尔科夫决策过程(MDP)
知识点3: RL机器人:探索环境,规划自己的人生
知识点4: 强化学习基本算法分类
知识点5: Model-Based RL: 已知环境,如何优化自己的人生
第2课 Model—Free Learning
知识点1: 环境未知,如何评估测略(状态价值)
知识点2: 蒙特卡洛方法学习状态价值函数
知识点3: TD方法学习状态价值函数
实战项目: 两种方法比较及代码实现
知识点5: OpenAI Gym介绍
第3课 Model-Free Control
知识点1: ϵ− 贪婪策略:平衡 Exploration and Exploitation
知识点2: on/off-policy 蒙特卡洛方法
知识点3: on/off-policy TD 算法 (Sara)
实战项目: on/off-policy 算法比较及代码实现
第4课 Q-Learning
知识点1: Q-Learning
知识点2: Deep Q-Learning
实战项目: Q-learning解决山地车问题
第5课 策略梯度学习
知识点1: 蒙特卡洛策略梯度
知识点2: Actor-Critic算法
实战项目: 用policy gradient解决连续山地车的问题
第6课 TensorFlow强化学习应用案例
实战项目: 使用Deep Q network 和 Policy gradient完成以下游戏:强化学习乒乓球游戏、强化学习flappy bird
〖视频截图〗:
〖百度网盘下载地址〗:
---------------------------------华丽分割线--------------------------------华丽分割线-------------------华丽分割线-------------------------华丽分割线----------------
〖下载地址失效反馈〗:
如果下载地址失效,请尽快反馈给我们,我们尽快修复。反馈地址:https://www.itmsf.com/forum-66-1.html
〖赞助VIP免学币下载全站资源〗:
全站资源高清无密,每天更新,vip特权了解一下:https://www.itmsf.com/plugin.php?id=threed_vip
〖客服24小时咨询〗:
有任何问题,请点击右侧QQ咨询。
|