Параметри
Веб-застосунок для токенізації тексту українською мовою
Дата випуску :
2022
Автор(и) :
Бірюкова Анастасія Ігорівна
Анотація :
При виконанні даної роботи було проведено аналітичних огляд існуючих рішень, а саме три типи алгоритмів для токенізації. Було проведено аналіз щодо поширення використання української мови, було розглянуто проблеми, які можуть виникнути в результаті неоднозначності використання знаків пунктуації; було поставлено задачу для створення веб-застосунку. Було розроблено алгоритм для токенізації тексту; розроблено систему та представлено її узагальнену архітектуру; було розроблено макет веб-сторінки. Також було наведено опис програмної реалізації розробленої системи. А саме: було наведено використані технології під час розробки; було показано фізичну структуру проекту і окремих модулів; було продемонстровано роботу веб-застосунку для токенізації тексту українською мовою. Даний веб-застосунок може знайти своє практичне застосування як підсистема, необхідна для розробки більших проектів у галузі NLP. Даний програмний продукт у майбутньому можна розширювати, функіонал доповнювати розробками інших етапів обробки природної мови. У результаті можна створити великий комерційний проект задля автоматизації багатьох процесів взаємодії людини та комп’ютера.
Бібліографічний опис :
Бірюкова А. І. Веб-застосунок для токенізації тексту українською мовою : випускна кваліфікаційна робота бакалавра : 126 Інформаційні системи та технології / Бірюкова Анастасія Ігорівна. - Київ, 2022. – 61 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
3.28 MB
Контрольна сума:
(MD5):09120232bcba36881cc172d3ea5641c8
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC