Параметри
Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання
Тип публікації :
Магістерська робота
Дата випуску :
2025
Автор(и) :
Лаврій, Софія
Науковий(і) керівник(и)/редактор(и) :
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Цитування :
Лаврій С. Розробка системи автоматичної класифікації користувацьких відгуків із використанням методів машинного навчання : кваліфікаційна робота магістра : 122 Комп’ютерні науки / наук. кер. І. В. Мірошниченко. Київ, 2025. 109 с.
Мета дипломної роботи магістра – збільшення ефективності аналізу зворотного зв’язку користувачів шляхом розробки та впровадження моделі автоматичної класифікації україномовних коментарів в умовах обмеженої доступності розмічених даних.
Обʼєкт дослідження – текстові коментарі користувачів, зібрані в межах опитувань щодо якості контенту на платформі.
Предмет дослідження – методи автоматизованої обробки та класифікації текстових коментарів користувачів за тематичними категоріями з використанням інструментів Data Science.
Наукова новизна дослідження полягає у порівнянні підходів напівконтрольованого навчання для багатокласової класифікації текстів.
У роботі проведено огляд сучасних підходів до класифікації текстових даних в умовах обмеженої кількості розмічених прикладів. Здійснено попередню обробку користувацьких коментарів, їх векторизацію за допомогою методів TF-IDF та MiniLM, а також реалізовано побудову базових моделей класифікації (логістична регресія, випадковий ліс, SVM, XGBoost). Проведено експерименти із застосуванням методів самонавчання та співнавчання для підвищення якості класифікації. Оцінено точність моделей за допомогою метрик precision, recall та F1-міри. Розроблено простий інтерфейс для демонстрації результатів класифікації та сформульовано висновки щодо ефективності різних підходів.
Дипломна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Загальний обсяг – 110 сторінок, кількість джерел – 29.
Ключові слова: класифікація тексту, машинне навчання, слабоконтрольоване навчання, самонавчання, співнавчання, MiniLM, TF-IDF, аналіз коментарів, активне навчання, моделі класифікації.
Обʼєкт дослідження – текстові коментарі користувачів, зібрані в межах опитувань щодо якості контенту на платформі.
Предмет дослідження – методи автоматизованої обробки та класифікації текстових коментарів користувачів за тематичними категоріями з використанням інструментів Data Science.
Наукова новизна дослідження полягає у порівнянні підходів напівконтрольованого навчання для багатокласової класифікації текстів.
У роботі проведено огляд сучасних підходів до класифікації текстових даних в умовах обмеженої кількості розмічених прикладів. Здійснено попередню обробку користувацьких коментарів, їх векторизацію за допомогою методів TF-IDF та MiniLM, а також реалізовано побудову базових моделей класифікації (логістична регресія, випадковий ліс, SVM, XGBoost). Проведено експерименти із застосуванням методів самонавчання та співнавчання для підвищення якості класифікації. Оцінено точність моделей за допомогою метрик precision, recall та F1-міри. Розроблено простий інтерфейс для демонстрації результатів класифікації та сформульовано висновки щодо ефективності різних підходів.
Дипломна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Загальний обсяг – 110 сторінок, кількість джерел – 29.
Ключові слова: класифікація тексту, машинне навчання, слабоконтрольоване навчання, самонавчання, співнавчання, MiniLM, TF-IDF, аналіз коментарів, активне навчання, моделі класифікації.
Галузі знань та спеціальності :
122 Комп’ютерні науки
Галузі науки і техніки (FOS) :
Комп'ютерні та інформаційні науки
Тип зібрання :
Publication
Файл(и) :
Ескіз недоступний
Формат
Adobe PDF
Розмір :
5.35 MB
Контрольна сума:
(MD5):a15cc08b6a657f83b94676b175aaa5a5
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC