强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线

9
回复
41321
查看
打印 上一主题 下一主题
[复制链接]
  • TA的每日心情

    5 天前
  • 签到天数: 1364 天

    [LV.10]以坛为家III

    2350

    主题

    4005

    帖子

    49万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    494876
    强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线
    强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线


    〖课程介绍〗:


      强化学习,被誉为可能通向强人工智能的第三类机器学习方法,在AI游戏领域的应用已司空见惯,如自动玩flappy bird,借助强化学习玩星际争霸,最近非常火的王者荣耀也不例外;在无人驾驶、自动交易等领域也有着举足轻重的作用。
            《强化学习》课程,带你揭秘AlphaGo和星际争霸/王者荣耀,华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。

    〖课程目录〗:
         第1课 强化学习RL简介
    知识点1: 强化学习定义:可能通向强人工智能的第三类机器学习方法
    知识点2: 强化学习数学模型:马尔科夫决策过程(MDP)
    知识点3: RL机器人:探索环境,规划自己的人生
    知识点4: 强化学习基本算法分类
    知识点5: Model-Based RL: 已知环境,如何优化自己的人生
    第2课 Model—Free Learning
    知识点1: 环境未知,如何评估测略(状态价值)
    知识点2: 蒙特卡洛方法学习状态价值函数
    知识点3: TD方法学习状态价值函数
    实战项目: 两种方法比较及代码实现
    知识点5: OpenAI Gym介绍
    第3课 Model-Free Control
    知识点1: ϵ− 贪婪策略:平衡 Exploration and Exploitation
    知识点2: on/off-policy 蒙特卡洛方法
    知识点3: on/off-policy TD 算法 (Sara)
    实战项目: on/off-policy 算法比较及代码实现
    第4课 Q-Learning
    知识点1: Q-Learning
    知识点2: Deep Q-Learning
    实战项目: Q-learning解决山地车问题
    第5课 策略梯度学习
    知识点1: 蒙特卡洛策略梯度
    知识点2: Actor-Critic算法
    实战项目: 用policy gradient解决连续山地车的问题
    第6课 TensorFlow强化学习应用案例
    实战项目: 使用Deep Q network 和 Policy gradient完成以下游戏:强化学习乒乓球游戏、强化学习flappy bird


    〖视频截图〗:
    强化学习 [一举解开AlphaGo Zero的百胜奥秘]-2019年七月Z线
    〖百度网盘下载地址〗:
    游客,如果您要查看本帖隐藏内容请回复



    ---------------------------------华丽分割线--------------------------------华丽分割线-------------------华丽分割线-------------------------华丽分割线----------------

    〖下载地址失效反馈〗:
    如果下载地址失效,请尽快反馈给我们,我们尽快修复。反馈地址:https://www.itmsf.com/forum-66-1.html

    〖赞助VIP免学币下载全站资源〗:
    全站资源高清无密,每天更新,vip特权了解一下:https://www.itmsf.com/plugin.php?id=threed_vip

    〖客服24小时咨询〗:
    有任何问题,请点击右侧QQ咨询。

    IT码上发视频网 - 免责声明1、站内所有资源来源于网络用户分享,版权归原作者及其网站所有,本站不拥有此类资源的版权,不对任何资源负法律责任。
    2、本站仅为资源分享的平台,站内资源仅供会员参考和学习之用,不得用于其他非法用途,请下载后24小时内从您的电脑中彻底删除。否则,一切后果请用户自负。
    3、本站会员均可发帖,转载及发布的内容纯属会员个人意见,与本论坛立场无关。严禁在本站发布反动、色情、广告等不良信息及违法内容。
    4、IT码上发视频网作为网络服务提供者,由于网站信息量巨大,对非法转载、盗版行为的发生不具备充分的监控能力。但是当版权拥有者提出侵权指控并出示充分的版权证明材料时,IT码上发视频网负有移除非法转载和盗版内容以及停止继续传播的义务。
    5、IT码上发视频网在满足前款条件下采取移除等相应措施后不为此向原发布人承担违约责任或其他法律责任,包括不承担因侵权指控不成立而给原发布人带来损害的赔偿责任。
    6、IT码上发视频网为用户免费分享产生,如本帖侵犯到任何版权问题,请立即告知本站(1198889304@qq.com),本站将及时予与删除并致以最深的歉意
    7、IT码上发视频网管理员和版主有权不事先通知发贴者而删除本文
    8、凡登陆本网站或直接、间接使用本站资料者,应仔细阅读声明,一旦使用本站任何资源,即被视为您已接受本站的免责声明。
    收藏
    收藏1
    转播
    转播
    支持
    支持0
    反对
    反对0
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用心服务IT技术爱好者
    资源涵盖Java,PHP,C/C++,Python,Android,iOS
    微信小程序,人工智能,大数据云计算,web前端
    游戏开发,多媒体与设计,运维相关,产品相关
    等等等有价值的VIP资源
    QQ:1198889304
    周一至周日 9:00-21:00
    意见反馈:1198889304@qq.com

    申明:本站所有资源均来自于互联网用户分享,仅供参考和学习之用,不得传播及用于其他用途,请24小时内自行删除,本站不对任何资源负法律责任。如有侵犯您的版权,请联系客服发邮件到1198889304@qq.com联系删除相关内容!