Deep deterministic policy gradient

1. Deep Deterministic Policy Gradient DDPG

2. History

3. ML methods

4. ML methods

5. Supervised vs Unsupervised

6. Supervised process

7. Supervised uses

8. Unsupervised

9. Unsupervised

10. Neural network types

11. Gradient Descent

12. Reinforcement learning

13. Grid worlds

14. Value function vs Policy

15. Actor critic

16. Actor critic method

17. DDPG - Continuous state and action space - Replay buffer - Soft updates - Exploration noise

18. Pitfalls - Designing reward function is very hard - Tends to get stuck into local optima - Unstable - Needs lots of training samples

19. Driving in simulator

More Related Content