Параметри
Розробка моделей та інформаційної технології прогнозування трендів для платформи YouTube за допомогою методів науки про дані
Тип публікації :
Магістерська робота
Дата випуску :
2025
Автор(и) :
Майданик Андрій Олександрович
Науковий(і) керівник(и)/редактор(и) :
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Цитування :
Майданик А. О. Розробка моделей та інформаційної технології прогнозування трендів для платформи YouTube за допомогою методів науки про дані : кваліфікаційна робота магістра : 122 Комп’ютерні науки / наук. кер. О. В. Заріцький. Київ, 2025. 96 с.
Мета дипломної роботи – Покращити прогнозування попадання відео до списку «Trending» на YouTube в перші дні після публікації, застосувавши комбіновані часові, текстові та поведінкові ознаки і сучасні алгоритми машинного навчання.
Об’єкт дослідження – процеси формування трендовості відеоконтенту на платформі YouTube.
Предмет дослідження – методи фічер‑інжинірингу, алгоритми машинного навчання та інженерні підходи до розгортання моделей, що забезпечують прогноз трендовості відео.
Наукова новизна роботи полягає в розробці комплексного Data Science‑пайплайна, який:
• використовує комбіновані часові, текстові та поведінкові ознаки, сформовані з метаданих YouTube;
• застосовує балансування класів SMOTE у зв’язці з градієнтним бустингом та аналізом важливості ознак (SHAP);
• інтегрується у продукційний веб‑сервіс Flask з автоматичним обчисленням фіч та REST‑endpoint /predict.
Практична цінність полягає у створенні модульного інструменту, який може використовуватися авторами контенту, маркетологами та аналітиками для оперативного передбачення перспективності відео, оптимізації контент‑стратегій і рекламних бюджетів.
У роботі виконано: аналіз літератури й існуючих систем прогнозування трендів; побудову та оцінку моделей (Random Forest, XGBoost, LightGBM); розробку Flask‑сервісу та тестування його продуктивності; економічне обґрунтування розгортання у хмарній інфраструктурі.
Об’єкт дослідження – процеси формування трендовості відеоконтенту на платформі YouTube.
Предмет дослідження – методи фічер‑інжинірингу, алгоритми машинного навчання та інженерні підходи до розгортання моделей, що забезпечують прогноз трендовості відео.
Наукова новизна роботи полягає в розробці комплексного Data Science‑пайплайна, який:
• використовує комбіновані часові, текстові та поведінкові ознаки, сформовані з метаданих YouTube;
• застосовує балансування класів SMOTE у зв’язці з градієнтним бустингом та аналізом важливості ознак (SHAP);
• інтегрується у продукційний веб‑сервіс Flask з автоматичним обчисленням фіч та REST‑endpoint /predict.
Практична цінність полягає у створенні модульного інструменту, який може використовуватися авторами контенту, маркетологами та аналітиками для оперативного передбачення перспективності відео, оптимізації контент‑стратегій і рекламних бюджетів.
У роботі виконано: аналіз літератури й існуючих систем прогнозування трендів; побудову та оцінку моделей (Random Forest, XGBoost, LightGBM); розробку Flask‑сервісу та тестування його продуктивності; економічне обґрунтування розгортання у хмарній інфраструктурі.
Галузі знань та спеціальності :
122 Комп’ютерні науки
Галузі науки і техніки (FOS) :
Інженерія та технології
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
2.58 MB
Контрольна сума:
(MD5):edade79744c48475bc3545e7e23c6584
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC