Skip to content
/ ql-dql Public

comparison of q-learning and deep q-learning

Notifications You must be signed in to change notification settings

wybin4/ql-dql

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ql-dql

в данной реализации используются возможности python и библиотеки numpy для реализации алгоритма q-обучения. для реализации алгоритма глубокого q-обучения используется tensorflow. требования к версиям можно найти в проекте. среда построена без использования OpenAi Gym. она содержит три объекта - агента, цель и анти-цель. агент может совершать четыре действия. эффективность алгоритмов сравнивается по количеству набранных агентом очков в течение эпизода.

запуск

  1. клонируйте репозиторий (git clone https://github.com/ajdivotf/ql-dql)
  2. перейдите в исходную папку
  3. откройте коммандную строку
  4. установите библиотеки
  5. запустите один из файлов - q-learning или deep-q-learning
  6. подождите, пока завершится обучение
  7. готово!

результаты

  1. сначала агент не обучен. он совершает неверный выбор и очень долго "думает", прежде чем это сделать.

  1. затем агент учиться делать верный выбор, но это более медленно, чем следовало бы.

  1. и наконец полностью обученный агент, набирающий свой максимальный результат, выглядит так:

Releases

No releases published

Packages

No packages published

Languages