Репозитарій КНУ
  • Yкраї́нська
  • English
  • Увійти
    Новий користувач? Зареєструйтесь.Забули пароль?
Репозитарій КНУ
  • Фонди & Зібрання
  • Статистика
  • Yкраї́нська
  • English
  • Увійти
    Новий користувач? Зареєструйтесь.Забули пароль?
  1. Головна
 
  • Деталі
Параметри

Статистична класифікація тексту

Тип публікації :
Бакалаврська робота
Дата випуску :
2023
Автор(и) :
Куценький Олексій Олександрович
Мова основного тексту :
eKNUTSHIR URL :
https://ir.library.knu.ua/handle/123456789/5391
Цитування :
Куценький О. О. Статистична класифікація тексту : кваліфікаційна робота … бакалавр : 124 Системний аналіз / Куценький Олексій Олександрович. – Київ, 2023. – 44 с.
У роботі будо розглянуто низку методів та алгоритмів обробки природньої мови. Базові методи попередньої обробки тексту та його векторизації, від простих - Торба слів, TF-IDF, до сучасних комплексних - Word2Vec, GloVe, що здатні передавати семантичне значення слів.
Результатом кваліфікаційної роботи стало програмне забезпечення, що реалізує роботу моделі нейронної мережі для класифікації тексту за допомогою алгоритму випадкового лісу. Для прикладу модель була натренована на невеликому датасеті “симптоми-хвороба” з досягнутою точністю близько 95 відсотків на тестових даних.
Задля демонстрації роботи моделі як інтерфейс був розроблений чат-бот у месенджері Telegram, що використовує побудовану модель як генератор відповіді на повідомлення користувача.

Ключові слова: обробки природної мови, попередня обробка тексту, векторизація тексту, вкладання слів, дерева рішень, випадковий ліс, кероване навчання, класифікація.
Key words: natural language processing, text preprocessing, text vectorization, word embedding, decision trees, random forest, supervised learning, classification.
Галузі знань та спеціальності :
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Ескіз
Формат

Adobe PDF

Розмір :

1.43 MB

Контрольна сума:

(MD5):e4fb142ffdb5a47b6333ce8953f9b743

Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC

Налаштування куків Політика приватності Угода користувача Надіслати відгук

Побудовано за допомогою Програмне забезпечення DSpace-CRIS - Розширення підтримується та оптимізується 4Наука

м. Київ, вул. Володимирська, 58, к. 42

(044) 239-33-30

ir.library@knu.ua