Параметри
Розробка моделей та інформаційної технології прогнозування трендів для платформи YouTube за допомогою методів науки про дані
Тип публікації :
Магістерська робота
Дата випуску :
2025
Автор(и) :
Майданик, Андрій Олександрович
Науковий(і) керівник(и)/редактор(и) :
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Цитування :
Майданик А. О. Розробка моделей та інформаційної технології прогнозування трендів для платформи YouTube за допомогою методів науки про дані : кваліфікаційна робота магістра : 122 Комп’ютерні науки / наук. кер. О. В. Заріцький. Київ, 2025. 96 с.
Мета дипломної роботи – Покращити прогнозування попадання відео до списку «Trending» на YouTube в перші дні після публікації, застосувавши комбіновані часові, текстові та поведінкові ознаки і сучасні алгоритми машинного навчання
Об’єкт дослідження – процеси формування трендовості відеоконтенту на платформі YouTube.
Предмет дослідження – методи фічер‑інжинірингу, алгоритми машинного навчання та інженерні підходи до розгортання моделей, що забезпечують прогноз трендовості відео.
Наукова новизна роботи полягає в розробці комплексного Data Science‑пайплайна, який:
• використовує комбіновані часові, текстові та поведінкові ознаки, сформовані з метаданих YouTube;
• застосовує балансування класів SMOTE у зв’язці з градієнтним бустингом та аналізом важливості ознак (SHAP);
• інтегрується у продукційний веб‑сервіс Flask з автоматичним обчисленням фіч та REST‑endpoint /predict.
Практична цінність полягає у створенні модульного інструменту, який може використовуватися авторами контенту, маркетологами та аналітиками для оперативного передбачення перспективності відео, оптимізації контент‑стратегій і рекламних бюджетів.
У роботі виконано: аналіз літератури й існуючих систем прогнозування трендів; побудову та оцінку моделей (Random Forest, XGBoost, LightGBM); розробку Flask‑сервісу та тестування його продуктивності; економічне обґрунтування розгортання у хмарній інфраструктурі.
Дипломна робота складається зі вступу, чотирьох розділів, висновків та списку використаних джерел. Загальний обсяг – 92 сторінки, перелік джерел – 36 найменувань на 4 сторінках, додатки – 3.
Ключові слова: прогнозування трендів, YouTube, Data Science, машинне навчання, Flask, SMOTE, XGBoost,XGB, LGBM, SMOTE, CI/CD
Об’єкт дослідження – процеси формування трендовості відеоконтенту на платформі YouTube.
Предмет дослідження – методи фічер‑інжинірингу, алгоритми машинного навчання та інженерні підходи до розгортання моделей, що забезпечують прогноз трендовості відео.
Наукова новизна роботи полягає в розробці комплексного Data Science‑пайплайна, який:
• використовує комбіновані часові, текстові та поведінкові ознаки, сформовані з метаданих YouTube;
• застосовує балансування класів SMOTE у зв’язці з градієнтним бустингом та аналізом важливості ознак (SHAP);
• інтегрується у продукційний веб‑сервіс Flask з автоматичним обчисленням фіч та REST‑endpoint /predict.
Практична цінність полягає у створенні модульного інструменту, який може використовуватися авторами контенту, маркетологами та аналітиками для оперативного передбачення перспективності відео, оптимізації контент‑стратегій і рекламних бюджетів.
У роботі виконано: аналіз літератури й існуючих систем прогнозування трендів; побудову та оцінку моделей (Random Forest, XGBoost, LightGBM); розробку Flask‑сервісу та тестування його продуктивності; економічне обґрунтування розгортання у хмарній інфраструктурі.
Дипломна робота складається зі вступу, чотирьох розділів, висновків та списку використаних джерел. Загальний обсяг – 92 сторінки, перелік джерел – 36 найменувань на 4 сторінках, додатки – 3.
Ключові слова: прогнозування трендів, YouTube, Data Science, машинне навчання, Flask, SMOTE, XGBoost,XGB, LGBM, SMOTE, CI/CD
Галузі знань та спеціальності :
122 Комп’ютерні науки
Галузі науки і техніки (FOS) :
Комп'ютерні та інформаційні науки
Тип зібрання :
Publication
Файл(и) :
Ескіз недоступний
Формат
Microsoft Word XML
Розмір :
6.59 MB
Контрольна сума:
(MD5):b0ef61e0c25e4d442af5c4a531d6c156
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC