Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання

Лаврій, Софія

Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання

Тип публікації :

Магістерська робота

Дата випуску :

2025

Автор(и) :

Лаврій, Софія

Кафедра технологій управління

Науковий(і) керівник(и)/редактор(и) :

Мірошниченко, Ігор Вікторович

Кафедра технологій управління

Мова основного тексту :

Ukrainian

eKNUTSHIR URL :

https://ir.library.knu.ua/handle/15071834/20195

Цитування :

[APA 7] Лаврій, С. (2025). Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання. [Магістерська робота, Київський національний університет імені Тараса Шевченка]. eKNUTSHIR. https://ir.library.knu.ua/handle/15071834/20195

[ДСТУ] Лаврій С. Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання : кваліфікаційна робота магістра : 122 Комп’ютерні науки / наук. кер. І. В. Мірошниченко. Київ, 2025. 109 с. URL: https://ir.library.knu.ua/handle/15071834/20195 (дата звернення: 17.07.2026).

Мета дипломної роботи магістра – збільшення ефективності аналізу зворотного зв’язку користувачів шляхом розробки та впровадження моделі автоматичної класифікації україномовних коментарів в умовах обмеженої доступності розмічених даних.
Обʼєкт дослідження – текстові коментарі користувачів, зібрані в межах опитувань щодо якості контенту на платформі.
Предмет дослідження – методи автоматизованої обробки та класифікації текстових коментарів користувачів за тематичними категоріями з використанням інструментів Data Science.
Наукова новизна дослідження полягає у порівнянні підходів напівконтрольованого навчання для багатокласової класифікації текстів.
У роботі проведено огляд сучасних підходів до класифікації текстових даних в умовах обмеженої кількості розмічених прикладів. Здійснено попередню обробку користувацьких коментарів, їх векторизацію за допомогою методів TF-IDF та MiniLM, а також реалізовано побудову базових моделей класифікації (логістична регресія, випадковий ліс, SVM, XGBoost). Проведено експерименти із застосуванням методів самонавчання та співнавчання для підвищення якості класифікації. Оцінено точність моделей за допомогою метрик precision, recall та F1-міри. Розроблено простий інтерфейс для демонстрації результатів класифікації та сформульовано висновки щодо ефективності різних підходів.
Дипломна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Загальний обсяг – 110 сторінок, кількість джерел – 29.
Ключові слова: класифікація тексту, машинне навчання, слабоконтрольоване навчання, самонавчання, співнавчання, MiniLM, TF-IDF, аналіз коментарів, активне навчання, моделі класифікації.

Ключові слова :

класифікація тексту машинне навчання слабоконтрольоване навчання самонавчання співнавчання MiniLM TF-IDF аналіз коментарів активне навчання моделі класифікації

Галузі знань та спеціальності :

12 Інформаційні технології::122 Комп’ютерні науки

Галузі науки і техніки (FOS) :

Комп'ютерні та інформаційні науки

Файл(и) :

Формат :

Adobe PDF

Розмір :

5.35 MB

Контрольна сума :

(MD5):a15cc08b6a657f83b94676b175aaa5a5

Якщо не вказано інше, ця робота розповсюджується на умовах ліцензії Creative Commons Attribution-NonCommercial 4.0 International