九算AI实验室|18年专注网站优化-网站SEO-百度账户托管

专业百度优化、网站建设、网站优化、网站SEO、天津SEO、北京SEO以及谷歌优化，18年SEO经验，不上首页不收费,联系电话18526066814.

从入门到精通-Tensorflow深度强化学习课程

2019年4月17日 0条评论 278次阅读 0人点赞 9suan

从入门到精通的深度强化学习免费课程。

在本课程中，你将实现的一些Agent:

从入门到精通-Tensorflow深度强化学习课程插图

本课程包含一系列文章和视频，在这些文章和视频中，你将掌握成为深度强化学习专家所需的技能和架构。

通过使用Tensorflow平台，你将进行一系列有意思的实战：Play Space invaders、Doom、Sonic the dgedog等等！

课程主页

https://simoninithomas.github.io/Deep_reinforcement_learning_Course/

课程配套代码地址

https://github.com/simoninithomas/Deep_reinforcement_learning_Course

文末附本课程配套视频地址。

课程内容介绍

第一课：什么是深度强化学习？

课程概述：

在深入学习深度强化学习算法之前，需要学习一些需要掌握的基本概念。

什么是深度强化学习及其过程？

为什么奖励（reward）是RL的核心理念？

强化学习的三种方法是什么？

第二课: Q -学习

课程概述:

本节我们将学习Q学习算法以及如何用Numpy实现它。

从入门到精通-Tensorflow深度强化学习课程插图1

第三课:深度Q -学习

课程概述:

本节我们将学习Deep Q学习算法以及如何用Tensorflow实现它。

从入门到精通-Tensorflow深度强化学习课程插图2

第三课+ :深度Q学习的改进

课程概述:

本节主要讲解Deep Q学习的最新改进(Dueling DQN、优先体验补偿（Prioritized Experience Replay）和固定Q目标（fixed q-targets）)以及如何用Tensorflow实现它们。

第四课：策略梯度（Policy Gradient）

课程概述:

在本节中，你将学习策略梯度下降法以及如何使用Tensorflow实现它。

从入门到精通-Tensorflow深度强化学习课程插图3

第五课：Advantage Actor Critic( A2C )和异步Advantage Actor Critic( A3C )

课程概述:

你将学习Actor Critic logic以及如何实现A2C Agent，该Agent与Tensorflow一起play Sonic the Hedgehog。

从入门到精通-Tensorflow深度强化学习课程插图

第六部分: A2C风格的近似策略梯度下降法

课程概述:

你会学习如何在Tensorflow中实现PPO算法。

课程视频下载地址

公众号“深度学习与NLP”中回复“tndl19”获取下载地址。

往期精品内容推荐

入行量化，你必须知道的几点

《最全》2019年全球AI顶会整理

Jacob Eisenstein《自然语言处理》最新经典教材免费分享

MIT深度学习基础-2019视频课程分享

工业级实战 – 一文教会你基于Docker在Kubernetes上部署深度学习模型

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

先睹为快:神经网络顶会ICLR 2019论文热点分析

Geffery Hinton-数字代表模型从数据中抽取的知识、AI不会有寒冬

2018年下半年深度学习技术发展最新综述

精品教材-中文版《Tensorflow内核剖析》分享

机器学习圣经《模式识别与机器学习(PRML)-2018》pdf分享

好书推荐-《深度学习基础-构建下一代机器学习算法》免费下载

吴恩达-中文完整版《Mechine Learning Yearning》分享

从入门到精通-Tensorflow深度强化学习课程插图4

扫描下方二维码可以订阅哦！

从入门到精通-Tensorflow深度强化学习课程插图5

从入门到精通-Tensorflow深度强化学习课程插图6

DeepLearning_NLP

从入门到精通-Tensorflow深度强化学习课程插图8

深度学习与NLP

商务合作请联系微信号：lqfarmerlq

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可