Снитюк Віталій ЄвгеновичБірюкова Анастасія Ігорівна2023-03-082024-05-172023-03-082022Бірюкова А. І. Веб-застосунок для токенізації тексту українською мовою : випускна кваліфікаційна робота бакалавра : 126 Інформаційні системи та технології / Бірюкова Анастасія Ігорівна. - Київ, 2022. – 61 с.https://ir.library.knu.ua/handle/123456789/2727При виконанні даної роботи було проведено аналітичних огляд існуючих рішень, а саме три типи алгоритмів для токенізації. Було проведено аналіз щодо поширення використання української мови, було розглянуто проблеми, які можуть виникнути в результаті неоднозначності використання знаків пунктуації; було поставлено задачу для створення веб-застосунку. Було розроблено алгоритм для токенізації тексту; розроблено систему та представлено її узагальнену архітектуру; було розроблено макет веб-сторінки. Також було наведено опис програмної реалізації розробленої системи. А саме: було наведено використані технології під час розробки; було показано фізичну структуру проекту і окремих модулів; було продемонстровано роботу веб-застосунку для токенізації тексту українською мовою. Даний веб-застосунок може знайти своє практичне застосування як підсистема, необхідна для розробки більших проектів у галузі NLP. Даний програмний продукт у майбутньому можна розширювати, функіонал доповнювати розробками інших етапів обробки природної мови. У результаті можна створити великий комерційний проект задля автоматизації багатьох процесів взаємодії людини та комп’ютера.uaВеб-застосунок для токенізації тексту українською мовоюБакалаврська робота