Simple-E-greedy

a simple tabular Q-learning using epsilon-greedy on frozen ice openAI gym environment.

Result:

The red line represent the evolution of epsilon value over time. The blue line represent the average accuracy on goal-reaching task for the last 20 episodes. The x axis represent the episode id + 20.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Simple-E-greedy

Result:

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Simple-E-greedy

Result:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages