Параметри
Програмний модуль аналізу та обробки текстів у соціальних мережах
Software module for analysis and processing of texts in social networks
Дата випуску :
2023
Автор(и) :
Абрамов Кірілл Вікторович
Анотація :
У кваліфікаційній роботі проведено аналіз існуючих підходів та методів обробки неструктурованих текстових даних, методів тематичного моделювання, спроектовано програмний модуль аналізу та обробки текстів у соціальних мережах, на прикладі соціальної мережі Telegram, розроблено відповідне програмне забезпечення, програмно реалізовано метод тематичного моделювання.
У роботі була розглянута проблема процесу аналізу та обробки текстів у соціальних мережах на прикладі соціальної мережі Telegram.
Було зібрано текстові дані, що містять пости з каналів так званих «воєнкорів» соціальної мережі Телеграм. Для розробки програми парсингу телеграм каналів було використано Telegram клієнт Telethon.
Для програмної реалізації програмного модулю використано мову програмування Python. Для зберігання даних використовувалася СУБД PostgreSQL. Для розробки програмного модуля були використані компоненти бібліотек Telethon, Matplotlib, Pymorphy2, Numpy, Pandas, PyQt.
Результатом проведеної роботи є програмний модуль аналізу та обробки тексту. У програмному модулі реалізовано основні етапи обробки тексту та виконується процедура тематичного моделювання.
Ключові слова: NLP, машинне навчання, text mining, обробка тексту, тематичне моделювання, LSA, pLSA, LDA.
У роботі була розглянута проблема процесу аналізу та обробки текстів у соціальних мережах на прикладі соціальної мережі Telegram.
Було зібрано текстові дані, що містять пости з каналів так званих «воєнкорів» соціальної мережі Телеграм. Для розробки програми парсингу телеграм каналів було використано Telegram клієнт Telethon.
Для програмної реалізації програмного модулю використано мову програмування Python. Для зберігання даних використовувалася СУБД PostgreSQL. Для розробки програмного модуля були використані компоненти бібліотек Telethon, Matplotlib, Pymorphy2, Numpy, Pandas, PyQt.
Результатом проведеної роботи є програмний модуль аналізу та обробки тексту. У програмному модулі реалізовано основні етапи обробки тексту та виконується процедура тематичного моделювання.
Ключові слова: NLP, машинне навчання, text mining, обробка тексту, тематичне моделювання, LSA, pLSA, LDA.
In the graduation thesis, an analysis of existing approaches and methods of processing unstructured text data, methods of thematic modeling, a system of analysis and processing of texts in social networks was designed, using the Telegram social network as an example, appropriate software was developed, and a method of thematic modeling was implemented.
Keywords: NLP, machine learning, text mining, text processing, topic modeling, LSA, pLSA, LDA.
Keywords: NLP, machine learning, text mining, text processing, topic modeling, LSA, pLSA, LDA.
Бібліографічний опис :
Абрамов К. В. Програмний модуль аналізу та обробки текстів у соціальних мережах : кваліфікаційна робота … бакалавр : 122 Комп’ютерні науки / Абрамов Кірілл Вікторович. – Київ, 2023. – 74 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
2.77 MB
Контрольна сума:
(MD5):21d5e64d14e3b8e493cf6c33371b68eb
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC