强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线

itmsf · 发表于 2019-7-19 00:34:29

〖课程介绍〗:

  强化学习，被誉为可能通向强人工智能的第三类机器学习方法，在AI游戏领域的应用已司空见惯，如自动玩flappy bird，借助强化学习玩星际争霸，最近非常火的王者荣耀也不例外；在无人驾驶、自动交易等领域也有着举足轻重的作用。
      《强化学习》课程，带你揭秘AlphaGo和星际争霸/王者荣耀，华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。

〖课程目录〗:
   第1课强化学习RL简介
知识点1：强化学习定义：可能通向强人工智能的第三类机器学习方法
知识点2：强化学习数学模型：马尔科夫决策过程（MDP）
知识点3： RL机器人：探索环境，规划自己的人生
知识点4：强化学习基本算法分类
知识点5： Model-Based RL: 已知环境，如何优化自己的人生
第2课 Model—Free Learning
知识点1：环境未知，如何评估测略（状态价值）
知识点2：蒙特卡洛方法学习状态价值函数
知识点3： TD方法学习状态价值函数
实战项目：两种方法比较及代码实现
知识点5： OpenAI Gym介绍
第3课 Model-Free Control
知识点1： ϵ− 贪婪策略：平衡 Exploration and Exploitation
知识点2： on/off-policy 蒙特卡洛方法
知识点3： on/off-policy TD 算法 (Sara)
实战项目： on/off-policy 算法比较及代码实现
第4课 Q-Learning
知识点1： Q-Learning
知识点2： Deep Q-Learning
实战项目： Q-learning解决山地车问题
第5课策略梯度学习
知识点1：蒙特卡洛策略梯度
知识点2： Actor-Critic算法
实战项目：用policy gradient解决连续山地车的问题
第6课 TensorFlow强化学习应用案例
实战项目：使用Deep Q network 和 Policy gradient完成以下游戏：强化学习乒乓球游戏、强化学习flappy bird

〖视频截图〗:

〖百度网盘下载地址〗:

游客，如果您要查看本帖隐藏内容请回复

---------------------------------华丽分割线--------------------------------华丽分割线-------------------华丽分割线-------------------------华丽分割线----------------

〖下载地址失效反馈〗:
如果下载地址失效，请尽快反馈给我们，我们尽快修复。反馈地址：https://www.itmsf.com/forum-66-1.html

〖赞助VIP免学币下载全站资源〗:
全站资源高清无密，每天更新，vip特权了解一下：https://www.itmsf.com/plugin.php?id=threed_vip

〖客服24小时咨询〗:
有任何问题，请点击右侧QQ咨询。

hpc19950723 · 发表于 2020-8-1 18:11:42

激动人心，无法言表！【IT码上发视频学习网】太给力了！

mage · 发表于 2020-11-10 08:39:54

看到这样的好资源真是高兴！感谢【IT码上发视频学习网】的无私分享！

chengxuan · 发表于 2020-11-16 13:16:06

激动人心，无法言表！【IT码上发视频学习网】太给力了！

itmsfabcd123 · 发表于 2021-2-23 17:04:02

感谢楼主分享！

羊咩咩 · 发表于 2021-4-8 17:13:48

看到这样的好资源真是高兴！感谢【IT码上发视频学习网】的无私分享！

fliegend · 发表于 2022-6-2 09:16:37

真是被感动的痛哭流涕……厉害了，我的【IT码上发视频学习网】！

Blue · 发表于 2022-6-18 22:00:46

看到这样的好资源真是高兴！感谢【IT码上发视频学习网】的无私分享！

lyd723 · 发表于 2022-8-4 09:39:59

【IT码上发视频学习网】加油，我们都看好你哦，快分享更多好资源吧！

zhupi3314 · 发表于 2022-12-20 09:49:32

1111111111111

Java面试题第4季-最新大厂java面试真题(3.5

强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线

相关帖子

编程开发

互联网主流

其他热门

产品与服务