Параметри
Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання
Тип публікації :
Магістерська робота
Дата випуску :
2025
Автор(и) :
Лаврій С. П.
Науковий(і) керівник(и)/редактор(и) :
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Цитування :
Лаврій С. П. Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання : кваліфікаційна робота магістра : 122 Комп’ютерні науки / Наук. кер. І. В. Мірошниченко. Київ, 2025. 109 с.
Мета дипломної роботи магістра – збільшення ефективності аналізу зворотного зв’язку користувачів шляхом розробки та впровадження моделі автоматичної класифікації україномовних коментарів в умовах обмеженої доступності розмічених даних.
Обʼєкт дослідження – текстові коментарі користувачів, зібрані в межах опитувань щодо якості контенту на платформі.
Предмет дослідження – методи автоматизованої обробки та класифікації текстових коментарів користувачів за тематичними категоріями з використанням інструментів Data Science.
Наукова новизна дослідження полягає у порівнянні підходів напівконтрольованого навчання для багатокласової класифікації текстів.
У роботі проведено огляд сучасних підходів до класифікації текстових даних в умовах обмеженої кількості розмічених прикладів. Здійснено попередню обробку користувацьких коментарів, їх векторизацію за допомогою методів TF-IDF та MiniLM, а також реалізовано побудову базових моделей класифікації (логістична регресія, випадковий ліс, SVM, XGBoost). Проведено експерименти із застосуванням методів самонавчання та співнавчання для підвищення якості класифікації. Оцінено точність моделей за допомогою метрик precision, recall та F1-міри. Розроблено простий інтерфейс для демонстрації результатів класифікації та сформульовано висновки щодо ефективності різних підходів.
Обʼєкт дослідження – текстові коментарі користувачів, зібрані в межах опитувань щодо якості контенту на платформі.
Предмет дослідження – методи автоматизованої обробки та класифікації текстових коментарів користувачів за тематичними категоріями з використанням інструментів Data Science.
Наукова новизна дослідження полягає у порівнянні підходів напівконтрольованого навчання для багатокласової класифікації текстів.
У роботі проведено огляд сучасних підходів до класифікації текстових даних в умовах обмеженої кількості розмічених прикладів. Здійснено попередню обробку користувацьких коментарів, їх векторизацію за допомогою методів TF-IDF та MiniLM, а також реалізовано побудову базових моделей класифікації (логістична регресія, випадковий ліс, SVM, XGBoost). Проведено експерименти із застосуванням методів самонавчання та співнавчання для підвищення якості класифікації. Оцінено точність моделей за допомогою метрик precision, recall та F1-міри. Розроблено простий інтерфейс для демонстрації результатів класифікації та сформульовано висновки щодо ефективності різних підходів.
Галузі знань та спеціальності :
122 Комп’ютерні науки
Галузі науки і техніки (FOS) :
Інженерія та технології
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
5.35 MB
Контрольна сума:
(MD5):a15cc08b6a657f83b94676b175aaa5a5
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC