ql-dql

в данной реализации используются возможности python и библиотеки numpy для реализации алгоритма q-обучения. для реализации алгоритма глубокого q-обучения используется tensorflow. требования к версиям можно найти в проекте. среда построена без использования OpenAi Gym. она содержит три объекта - агента, цель и анти-цель. агент может совершать четыре действия. эффективность алгоритмов сравнивается по количеству набранных агентом очков в течение эпизода.

запуск

клонируйте репозиторий (git clone https://github.com/ajdivotf/ql-dql)
перейдите в исходную папку
откройте коммандную строку
установите библиотеки
запустите один из файлов - q-learning или deep-q-learning
подождите, пока завершится обучение
готово!

результаты

сначала агент не обучен. он совершает неверный выбор и очень долго "думает", прежде чем это сделать.

затем агент учиться делать верный выбор, но это более медленно, чем следовало бы.

и наконец полностью обученный агент, набирающий свой максимальный результат, выглядит так:

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
results		results
tables		tables
README.md		README.md
deep q learning.py		deep q learning.py
graphics dql.py		graphics dql.py
object.py		object.py
q_learning.py		q_learning.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ql-dql

запуск

результаты

About

Releases

Packages

Languages

wybin4/ql-dql

Folders and files

Latest commit

History

Repository files navigation

ql-dql

запуск

результаты

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages