Параметри
Генерація стратегій переслідування за допомогою навчання з підкріпленням
Дата випуску :
2022
Автор(и) :
Рамик Іван
Анотація :
В даній роботі були описані підходи до побудови моделей навчання з підкріпленням, розглянуті особливості їх тренування. Був застосований алгоритм АЗС до задачі переслідування з двома жертвами, формалізований у термінах марковської гри. Натреновані стратегії "Хижака" та "Жертви" були протестовані. також було проведено порівняння цих стратегій зі стратегіями на базі евристик.
Бібліографічний опис :
Рамик І. Генерація стратегій переслідування за допомогою навчання з підкріпленням : кваліфікаційна робота … бакалавра : 121 Інженерія програмного забезпечення / Рамик Іван. – Київ, 2022. – 26 с.
Файл(и) :![Ескіз](https://ir.library.knu.ua/server/api/core/bitstreams/6f186495-5a7f-4ea1-98a6-81127e5777fd/content)
Вантажиться...
Формат
Adobe PDF
Розмір :
358.61 KB
Контрольна сума:
(MD5):d9e879080ff2461fff6af12acfff6f88