欢迎来到深度强化学习2.0!
在这个课程中,我们回学习并且实现一个新的AI模型,较早双延迟DDPG。它是包括了当前最先进的人工智能技术,包括连续性双深度Q-learning,策略梯度,以及演员评论家模型。这个模型非常的强大,利用它,我们可以在课程中第一次解决最具有挑战性的AI问题(训练一个蚂蚁/蜘蛛,以及一个半人形机器人,让它走路或者跑过原野)。
为了构建这个模型,我们分成三步来处理:
第一部分:基础讲解
在这一部分中,我们会学习人工智能的所有必须基础部分。这部分之后,大家可以掌握AI的基础知识,其中包括,Q-Learning,深度Q-learning,策略梯度,演员评论家模型以及更多。
第二部分:双延迟DDPG理论
这一部分中我们会深入学习整个模型背后的理论知识。大家会通过一系列的视觉呈现幻灯片,清楚看到完整的AI构建以及训练的过程。不仅大家可以学到理论知识的细节,同时还可以构建坚实的AI学习以及运作的理论基础。第一部分中的理论基础,结合第二部分的细节解释,会让这些高不可攀的技术,在你面前变得唾手可得。最终大家会成为,少数一批最先掌握这门技术的人。
第三部分:双延迟DDPG的实现
欢迎来到深度强化学习2.0!
在这个课程中,我们回学习并且实现一个新的AI模型,较早双延迟DDPG。它是包括了当前最先进的人工智能技术,包括连续性双深度Q-learning,策略梯度,以及演员评论家模型。这个模型非常的强大,利用它,我们可以在课程中第一次解决最具有挑战性的AI问题(训练一个蚂蚁/蜘蛛,以及一个半人形机器人,让它走路或者跑过原野)。
为了构建这个模型,我们分成三步来处理:
第一部分:基础讲解
在这一部分中,我们会学习人工智能的所有必须基础部分。这部分之后,大家可以掌握AI的基础知识,其中包括,Q-Learning,深度Q-learning,策略梯度,演员评论家模型以及更多。
第二部分:双延迟DDPG理论
这一部分中我们会深入学习整个模型背后的理论知识。大家会通过一系列的视觉呈现幻灯片,清楚看到完整的AI构建以及训练的过程。不仅大家可以学到理论知识的细节,同时还可以构建坚实的AI学习以及运作的理论基础。第一部分中的理论基础,结合第二部分的细节解释,会让这些高不可攀的技术,在你面前变得唾手可得。最终大家会成为,少数一批最先掌握这门技术的人。
第三部分:双延迟DDPG的实现
我们会从最基础开始构建这个模型,一步一步,通过互动的部分,这也是这一课程新增加的一个亮点,大家可以自己练习代码的实现部分,跟我们一起进行模型的实现。通过这些练习,大家不再只是被动地跟着课程走,而是主动地、更有效地提高技术。最后还有一点很重要的是,我们所有的实现部分都会放在Colaboratory中来做,也叫做Google Colab,这是一个完全免费的开源的人工智能平台,让大家可以进行编码,训练AI模型,而免去在自己的机器上安装各种资源包的困扰。换句话说,大家在执行代码的时候,可以百分百的确信,可以最后拿到蜘蛛以及半人形机器人的训练视频。
OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.
Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.
Find this site helpful? Tell a friend about us.
We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.
Your purchases help us maintain our catalog and keep our servers humming without ads.
Thank you for supporting OpenCourser.