Веб-застосунок для токенізації тексту українською мовою
Дата
2022
Автори
Бірюкова Анастасія Ігорівна
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
При виконанні даної роботи було проведено аналітичних огляд існуючих рішень, а саме три типи алгоритмів для токенізації. Було проведено аналіз щодо поширення використання української мови, було розглянуто проблеми, які можуть виникнути в результаті неоднозначності використання знаків пунктуації; було поставлено задачу для створення веб-застосунку. Було розроблено алгоритм для токенізації тексту; розроблено систему та представлено її узагальнену архітектуру; було розроблено макет веб-сторінки. Також було наведено опис програмної реалізації розробленої системи. А саме: було наведено використані технології під час розробки; було показано фізичну структуру проекту і окремих модулів; було продемонстровано роботу веб-застосунку для токенізації тексту українською мовою. Даний веб-застосунок може знайти своє практичне застосування як підсистема, необхідна для розробки більших проектів у галузі NLP. Даний програмний продукт у майбутньому можна розширювати, функіонал доповнювати розробками інших етапів обробки природної мови. У результаті можна створити великий комерційний проект задля автоматизації багатьох процесів взаємодії людини та комп’ютера.
Бібліографічний опис
Галузь знань та спеціальність
12 Інформаційні технології , 126 Інформаційні системи та технології
Бібліографічний опис
Бірюкова А. І. Веб-застосунок для токенізації тексту українською мовою : випускна кваліфікаційна робота бакалавра : 126 Інформаційні системи та технології / Бірюкова Анастасія Ігорівна. - Київ, 2022. – 61 с.