Параметри
Підсистема моніторингу стану виснаження на роботі на основі семантичного аналізу твітів співробітників
Subsystem for monitoring the state of exhaustion at work based on the semantic analysis of employee tweets
Дата випуску :
2023
Автор(и) :
Боженко Дар’я Миколаївна
Анотація :
У кваліфікаційній роботі проведено аналіз методологій класифікації текстів, проведено дослідження параметрів та їх вплив на роботу моделі, розроблено веб-застосунок з інтелектуальним ядром на основі методу опорних векторів, для визначення ризику виснаження працівників на основі аналізу текстів твітів.
Було проведена розробка та модифікація обраної моделі, додано можливість представлення результатів у вигляді належності до класу. Після навчання модель продемонструвала наступні показники точності 98,7% на навчальній і 93% на тестовій вибірках. Для знаходження оптимальних параметрів моделі, було проведено експеременти для визначення впливу наступних параметрів на точність моделі: тип поєднання калібратора та моделі, штраф, ваги класів, параметр регуляризації.
Було визначено основні інформаційні складові застосунку, спроектовано його архітектуру, базу даних, відношення між компонентами, дизайн.
З використанням мови програмування Python та Django було розроблено веб-застосунок, де було реалізовано можливість запуску аналізу твітів зі сторінок реальних людей (працівників), графічне відображення результатів аналізу, графічне відображення статистики по всім працівникам.
Ключові слова: аналіз тексту, метод опорних векторів, класифікація тексту.
Було проведена розробка та модифікація обраної моделі, додано можливість представлення результатів у вигляді належності до класу. Після навчання модель продемонструвала наступні показники точності 98,7% на навчальній і 93% на тестовій вибірках. Для знаходження оптимальних параметрів моделі, було проведено експеременти для визначення впливу наступних параметрів на точність моделі: тип поєднання калібратора та моделі, штраф, ваги класів, параметр регуляризації.
Було визначено основні інформаційні складові застосунку, спроектовано його архітектуру, базу даних, відношення між компонентами, дизайн.
З використанням мови програмування Python та Django було розроблено веб-застосунок, де було реалізовано можливість запуску аналізу твітів зі сторінок реальних людей (працівників), графічне відображення результатів аналізу, графічне відображення статистики по всім працівникам.
Ключові слова: аналіз тексту, метод опорних векторів, класифікація тексту.
In this graduation thesis the text classification methodologies were analyzed and compared, a study of parameters and their influence on the model was carried out, a web application with an intelligent core based on the support vector machines method was developed to determine the risk of employee burnout based on tweet texts.
Keywords: text analysis, support vector machines, text classification.
Keywords: text analysis, support vector machines, text classification.
Бібліографічний опис :
Боженко Д.М. Підсистема моніторингу стану виснаження на роботі на основі семантичного аналізу твітів співробітників : кваліфікаційна робота … бакалавр : 122 Комп’ютерні науки / Боженко Дар’я Миколаївна. – Київ, 2023. – 74 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
3.27 MB
Контрольна сума:
(MD5):60ce939da7f393f937040aa3075c10ea
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC