你肯定听说过 Deepmind with AlphaGo Zero 和 OpenAI in Dota 2 取得的惊人成绩! 你难道不想知道他们是如何工作的吗?现在正是你我最终学会“深度强化学习”,并应用到已有项目的时机。
终极目标是使用这些多功能的技术,并应用他们到各种重要的真实世界问题中。Demis Hassabis
这个项目引导你完成从最基本的到高级的AlphaGo Zero深度强化学习算法。你可以发现按周组织的主题和建议学习资源。 同时,每周我会提供用Python实现的应用实例,帮助你更好地消化理论。
- 了解Python和PyTorch
- 机器学习
- 了解深度学习(MLP,CNN和RNN)
- Q-learning
- DQN
- AC2
- ES
- AlphaGo Zero