从入门到精通-Tensorflow深度强化学习课程

    从入门到精通的深度强化学习免费课程。

    在本课程中,你将实现的一些Agent:

从入门到精通-Tensorflow深度强化学习课程插图

    本课程包含一系列文章和视频,在这些文章和视频中,你将掌握成为深度强化学习专家所需的技能和架构。

    通过使用Tensorflow平台,你将进行一系列有意思的实战:Play Space invaders、Doom、Sonic the dgedog等等!

课程主页

    https://simoninithomas.github.io/Deep_reinforcement_learning_Course/


课程配套代码地址

    https://github.com/simoninithomas/Deep_reinforcement_learning_Course


    文末附本课程配套视频地址。


课程内容介绍


    第一课:什么是深度强化学习?

    课程概述:

    在深入学习深度强化学习算法之前,需要学习一些需要掌握的基本概念。

    什么是深度强化学习及其过程?

    为什么奖励(reward)是RL的核心理念?

    强化学习的三种方法是什么?

     

    第二课: Q -学习

    课程概述:

    本节我们将学习Q学习算法以及如何用Numpy实现它。

从入门到精通-Tensorflow深度强化学习课程插图1

     

    第三课:深度Q -学习

    课程概述:

    本节我们将学习Deep Q学习算法以及如何用Tensorflow实现它。

从入门到精通-Tensorflow深度强化学习课程插图2

     

    第三课+ :深度Q学习的改进

    课程概述:

    本节主要讲解Deep Q学习的最新改进(Dueling DQN、优先体验补偿(Prioritized Experience Replay)和固定Q目标(fixed q-targets))以及如何用Tensorflow实现它们。

     

    第四课:策略梯度(Policy Gradient)

    课程概述:

    在本节中,你将学习策略梯度下降法以及如何使用Tensorflow实现它。

从入门到精通-Tensorflow深度强化学习课程插图3

     

    第五课:Advantage Actor Critic( A2C )和异步Advantage Actor Critic( A3C )

    课程概述:

    你将学习Actor Critic logic以及如何实现A2C Agent,该Agent与Tensorflow一起play Sonic the Hedgehog。

从入门到精通-Tensorflow深度强化学习课程插图

     

    第六部分: A2C风格的近似策略梯度下降法

    课程概述:

    你会学习如何在Tensorflow中实现PPO算法。

课程视频下载地址

    公众号“深度学习与NLP”中回复“tndl19”获取下载地址。

往期精品内容推荐

入行量化,你必须知道的几点

《最全》2019年全球AI顶会整理

Jacob Eisenstein《自然语言处理》最新经典教材免费分享

MIT深度学习基础-2019视频课程分享

工业级实战 – 一文教会你基于Docker在Kubernetes上部署深度学习模型

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

先睹为快:神经网络顶会ICLR 2019论文热点分析

Geffery Hinton-数字代表模型从数据中抽取的知识、AI不会有寒冬

2018年下半年深度学习技术发展最新综述

精品教材-中文版《Tensorflow内核剖析》分享

机器学习圣经《模式识别与机器学习(PRML)-2018》pdf分享

好书推荐-《深度学习基础-构建下一代机器学习算法》免费下载

吴恩达-中文完整版《Mechine Learning Yearning》分享

从入门到精通-Tensorflow深度强化学习课程插图4
扫描下方二维码可以订阅哦!
从入门到精通-Tensorflow深度强化学习课程插图5
从入门到精通-Tensorflow深度强化学习课程插图6

DeepLearning_NLP

从入门到精通-Tensorflow深度强化学习课程插图7

从入门到精通-Tensorflow深度强化学习课程插图8

深度学习与NLP

从入门到精通-Tensorflow深度强化学习课程插图7

       商务合作请联系微信号:lqfarmerlq

    发送中

    点赞