Ліндер ЯрославРамик Іван2023-05-312024-05-142023-05-312022Рамик І. Генерація стратегій переслідування за допомогою навчання з підкріпленням : кваліфікаційна робота … бакалавра : 121 Інженерія програмного забезпечення / Рамик Іван. – Київ, 2022. – 26 с.https://ir.library.knu.ua/handle/123456789/3613В даній роботі були описані підходи до побудови моделей навчання з підкріпленням, розглянуті особливості їх тренування. Був застосований алгоритм АЗС до задачі переслідування з двома жертвами, формалізований у термінах марковської гри. Натреновані стратегії "Хижака" та "Жертви" були протестовані. також було проведено порівняння цих стратегій зі стратегіями на базі евристик.uaГенерація стратегій переслідування за допомогою навчання з підкріпленнямБакалаврська робота