Генерація стратегій переслідування за допомогою навчання з підкріпленням

Дата
2022
Автори
Рамик Іван
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
В даній роботі були описані підходи до побудови моделей навчання з підкріпленням, розглянуті особливості їх тренування. Був застосований алгоритм АЗС до задачі переслідування з двома жертвами, формалізований у термінах марковської гри. Натреновані стратегії "Хижака" та "Жертви" були протестовані. також було проведено порівняння цих стратегій зі стратегіями на базі евристик.
Бібліографічний опис
Галузь знань та спеціальність
12 Інформаційні технології , 121 Інженерія програмного забезпечення
Бібліографічний опис
Рамик І. Генерація стратегій переслідування за допомогою навчання з підкріпленням : кваліфікаційна робота … бакалавра : 121 Інженерія програмного забезпечення / Рамик Іван. – Київ, 2022. – 26 с.