Параметри
Генерація стратегій переслідування за допомогою навчання з підкріпленням
Дата випуску :
2022
Автор(и) :
Рамик Іван
Анотація :
В даній роботі були описані підходи до побудови моделей навчання з підкріпленням, розглянуті особливості їх тренування. Був застосований алгоритм АЗС до задачі переслідування з двома жертвами, формалізований у термінах марковської гри. Натреновані стратегії "Хижака" та "Жертви" були протестовані. також було проведено порівняння цих стратегій зі стратегіями на базі евристик.
Бібліографічний опис :
Рамик І. Генерація стратегій переслідування за допомогою навчання з підкріпленням : кваліфікаційна робота … бакалавра : 121 Інженерія програмного забезпечення / Рамик Іван. – Київ, 2022. – 26 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
358.61 KB
Контрольна сума:
(MD5):d9e879080ff2461fff6af12acfff6f88
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC