Options
Навчання з підкріпленням для генерації оптимальної стратегії агентів на прикладі задачі найшвидшого проходження маршруту транспортним засобом
Issue Date :
2023
Author(s) :
Золотарьова Марина
Abstract :
Об’єкт розроблення програмного засобу : навчання агента для оптимального проходження дистанції у наближених до реального життя умовах.
У ході дослідження розглянуто методи обраного способу машинного навчання (обрано спосіб навчання з підкріпленням) і визначено доцільний для обраної задачі; обрано алгоритм для реалізації програми : в якості алгоритму навчання було обрано метод Proximal Policy Optimization (PPO), вибрано необхідні бібліотеки і компоненти та встановлено їх у середовище розробки; створено програму, що створює та навчає агентів розвʼязувати задану задачу у заданих умовах. Встановлено необхідні модулі та здійснена реалізація програми мовою Python.
Ключові слова : proximal policy optimization, агент, машинне навчання, навчання з підкріпленням, середовище, стратегія, трек.
У ході дослідження розглянуто методи обраного способу машинного навчання (обрано спосіб навчання з підкріпленням) і визначено доцільний для обраної задачі; обрано алгоритм для реалізації програми : в якості алгоритму навчання було обрано метод Proximal Policy Optimization (PPO), вибрано необхідні бібліотеки і компоненти та встановлено їх у середовище розробки; створено програму, що створює та навчає агентів розвʼязувати задану задачу у заданих умовах. Встановлено необхідні модулі та здійснена реалізація програми мовою Python.
Ключові слова : proximal policy optimization, агент, машинне навчання, навчання з підкріпленням, середовище, стратегія, трек.
Bibliographic description :
Золотарьова М. Навчання з підкріпленням для генерації оптимальної стратегії агентів на прикладі задачі найшвидшого проходження маршруту транспортним засобом : кваліфікаційна робота … бакалавр : 121 Інженерія програмного забезпечення / Золотарьова Марина. – Київ, 2023. – 41 с.
File(s) :
Loading...
Format
Adobe PDF
Size :
2.24 MB
Checksum :
(MD5):76d4c6bd0763c4af116d21e7a5db2071
This work is distributed under the Creative Commons license CC BY-NC