Ясуди Кійохіко-КирилКостіков Микола Павлович2024-07-152024-07-152024Ясуди К.-К. Автоматичне визначення рівня GEFR українськомовних текстів та створення рівневого за шкалою GEFR корпусу текстів УМІ : кваліфікаційна робота бакалавра : 035.10 Філологія (прикладна лінгвістика) / наук. кер. М. П. Костіков. Київ, 2024. 75 с.https://ir.library.knu.ua/handle/15071834/2809Метою роботи є створення та тестування існуючих алгоритмів для текстової класифікації для задачі класифікації текстів українською мовою за рівнями CEFR. Об’єктом дослідження у даній роботі виступають тексти, написані українською мовою. Предметом дослідження є потенціал автоматичної класифікації цих текстів за рівнями CEFR. Досліджено існуючі алгоритми класифікації текстів. Створено власний індекс на основі морфологічної розмітки. Створено програму, що аналізує тексти на рівень CEFR та укладає корпус. Створено графічний інтерфейс користувача для даної програми. У результаті проведених досліджень було розроблено програму для аналізу тексту, яка здійснює граматичну анотацію, визначає параметри тексту (такі як довжина слова у символах та складах) і надає звіт щодо ймовірного рівня володіння мовою згідно CEFR. Крім того, програма генерує таблиці з проанотованими токенами та реченнями.uaАвтоматичне визначення рівня GEFR українськомовних текстів та створення рівневого за шкалою GEFR корпусу текстів УМІБакалаврська робота