Параметри
Розробка моделі та інформаційної технології прогнозування дорожньо-транспортних пригод методами Data Science
Тип публікації :
Магістерська робота
Дата випуску :
2025
Автор(и) :
Лаврій Руслан Романович
Науковий(і) керівник(и)/редактор(и) :
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Цитування :
Лаврій Р. Р. Розробка моделі та інформаційної технології прогнозування дорожньо-транспортних пригод методами Data Science : кваліфікаційна робота магістра : 122 Комп’ютерні науки / Наук. кер. Ю. Л. Хлевна. Київ, 2025. 98 с.
Мета дипломної роботи магістра – зменшити кількість ДТП шляхом виявлення ключових факторів ризику та прогнозуванням дорожніх пригод.
Об’єкт дослідження – процеси прогнозування дорожньо-транспортних пригод.
Предмет дослідження – Аналітичні та прогнозні моделі тяжкості ДТП, що використовують методи статистики, економетрії та машинного навчання.
Наукова новизна роботи полягає в поєднанні GMM із VAR/ARIMA для підвищення точності та застосуванні SHAP-аналітики та H20 ML для аналізу ефективності та коригування вагів.
У роботi розглянуто фактори, що впливають на тяжкість дорожньо транспортних пригод (ДТП) у Великій Британії, із застосуванням комплексного підходу: методів машинного навчання, економетричних моделей та традиційної статистики на основі довгострокових історичних даних. Розроблено аналітичний каркас, що включає описову та інтерпретативну статистику, біваріантний та мультиваріантний аналіз, кореляційний аналіз (коефіцієнти Пірсона та Спірмена), множинну логістичну регресію, оцінку мультиколінеарності та валідацію моделей. У часовому ряді використано моделі VAR та ARIMA, що забезпечили прогноз із середньою абсолютною масштабованою похибкою (MASE) 0,800 та середньою похибкою (ME) –73,80 порівняно з наївним прогнозом. У сфері машинного навчання побудовано класифікатор Random Forest (точність 73 %, повнота 78 %, F1-міра 73 %) та оптимізовано рішення за допомогою H2O AutoML, в результаті чого модель XGBoost показала RMSE = 0,1761 та MAE = 0,0874. Проведено факторний аналіз для виявлення латентних змінних та застосовано SHAP-аналіз (Explainable AI) для інтерпретації впливу атрибутів, серед яких найбільш значущими виявились Driver_Home_Area_Type, Longitude, Driver_IMD_Decile, Road_Type, Casualty_Home_Area_Type і Casualty_IMD_Decile. Дослідження поглиблює розуміння чинників тяжкості ДТП і демонструє ефективність поєднання статистичних, економетричних і машинно-навчальних підходів для обґрунтування політик підвищення безпеки на дорогах.
Об’єкт дослідження – процеси прогнозування дорожньо-транспортних пригод.
Предмет дослідження – Аналітичні та прогнозні моделі тяжкості ДТП, що використовують методи статистики, економетрії та машинного навчання.
Наукова новизна роботи полягає в поєднанні GMM із VAR/ARIMA для підвищення точності та застосуванні SHAP-аналітики та H20 ML для аналізу ефективності та коригування вагів.
У роботi розглянуто фактори, що впливають на тяжкість дорожньо транспортних пригод (ДТП) у Великій Британії, із застосуванням комплексного підходу: методів машинного навчання, економетричних моделей та традиційної статистики на основі довгострокових історичних даних. Розроблено аналітичний каркас, що включає описову та інтерпретативну статистику, біваріантний та мультиваріантний аналіз, кореляційний аналіз (коефіцієнти Пірсона та Спірмена), множинну логістичну регресію, оцінку мультиколінеарності та валідацію моделей. У часовому ряді використано моделі VAR та ARIMA, що забезпечили прогноз із середньою абсолютною масштабованою похибкою (MASE) 0,800 та середньою похибкою (ME) –73,80 порівняно з наївним прогнозом. У сфері машинного навчання побудовано класифікатор Random Forest (точність 73 %, повнота 78 %, F1-міра 73 %) та оптимізовано рішення за допомогою H2O AutoML, в результаті чого модель XGBoost показала RMSE = 0,1761 та MAE = 0,0874. Проведено факторний аналіз для виявлення латентних змінних та застосовано SHAP-аналіз (Explainable AI) для інтерпретації впливу атрибутів, серед яких найбільш значущими виявились Driver_Home_Area_Type, Longitude, Driver_IMD_Decile, Road_Type, Casualty_Home_Area_Type і Casualty_IMD_Decile. Дослідження поглиблює розуміння чинників тяжкості ДТП і демонструє ефективність поєднання статистичних, економетричних і машинно-навчальних підходів для обґрунтування політик підвищення безпеки на дорогах.
Галузі знань та спеціальності :
122 Комп’ютерні науки
Галузі науки і техніки (FOS) :
Інженерія та технології
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
1.82 MB
Контрольна сума:
(MD5):998310670bf9c3fba8c9dcaef365b04b
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC