Кличлієв КирилоКостіков Микола Павлович2024-07-162024-07-162024Кличлієв К. Автоматичне визначення хибних друзів перекладача для української та польської мов : кваліфікаційна робота бакалавра : 035.10 Філологія (прикладна лінгвістика) / наук. кер. М. Костіков. Київ, 2024. 70 с.https://ir.library.knu.ua/handle/15071834/2859Це дослідження присвячене створенню алгоритму автоматичного виявлення хибних друзів перекладача для української та польської мов. Актуальність роботи зумовлена відсутністю напрацювань у цьому напрямку для аналізованої пари мов, а також можливістю застосування такої системи, зокрема, для автоматизації укладання словників міжмовних омонімів і генерації вправ для вивчення таких слів. Об’єктом дослідження є українська та польська лексичні системи, а предметом – явище міжмовної омонімії, притаманне цим мовам. Створення алгоритму, здатного автоматично ідентифікувати пари хибних друзів перекладача, є метою й основним завданням цієї роботи. Для досягнення цієї мети були поставлені наступні завдання: аналіз українсько-польської міжмовної омонімії, виокремлення морфологічних і фонетичних особливостей цих мов, створення тестувальної вибірки українсько-польських лексичних пар, аналіз підходів і бібліотек, програмування алгоритму та демонстраційного вебзастосунку. У першому розділі здійснено теоретичний огляд наявних досліджень у галузі міжмовної омонімії, проаналізовано українську та польську лексичні системи в контексті слов'янських мов. Другий розділ присвячено створенню алгоритму автоматичного виявлення фальшивих друзів перекладача, а також вебзастосунку, що дозволяє користувачеві протестувати алгоритм на власних текстах. Результати дослідження показали, що створений класифікатор є ефективним інструментом для автоматичного виявлення фальшивих друзів перекладача в українській і польській мовах. Алгоритм поєднує традиційні NLP підходи із сучасними, зокрема, векторними репрезентаціями слів і мовними моделями. Майбутні напрямки дослідження охоплюють покращення точності класифікаторів, розширення датасету та лексичних категорій слів, а також подальші тестування й інтеграцію мовних моделей.This study is devoted to the creation of an algorithm for the automatic detection of false friends for the Ukrainian and Polish languages. The relevance of the work is due to the lack of research in this direction for the analyzed pair of languages, as well as the possibility of using such a system, in particular, to automate the compilation of dictionaries of interlingual homonyms and the generation of exercises for learning such words. The object of research is the Ukrainian and Polish lexical systems, and the subject is the phenomenon of interlingual homonymy inherent in these languages. The creation of an algorithm capable of automatically identifying pairs of false friends is the goal and main task of this work. To achieve this goal, the following tasks were set: analysis of Ukrainian-Polish interlingual homonymy, identification of morphological and phonetic features of these languages, creation of a test sample of Ukrainian-Polish lexical pairs, analysis of approaches and libraries, programming of an algorithm and a demonstration web application. In the first chapter, a theoretical review of available research in the field of interlingual homonymy was carried out, Ukrainian and Polish lexical systems were analyzed in the context of Slavic languages. The second section is devoted to the creation of an algorithm for automatic detection of false friends, as well as a web application that allows the user to test the algorithm on their own texts. The results of the study showed that the created classifier is an effective tool for automatic detection of false friends in the Ukrainian and Polish languages. The algorithm combines traditional NLP approaches with modern, in particular, word embeddings and language models. Future research areas include improving the accuracy of the classifiers, expanding the dataset and lexical word categories, as well as further testing and integration of language models.uaхибні друзі перекладачаміжмовна омоніміякласифікаціяукраїнська мовапольська моваобробка природної мовимашинне навчанняfalse friendsinterlingual homonymyclassificationUkrainianPolishnatural language processingmachine learningАвтоматичне визначення хибних друзів перекладача для української та польської мовБакалаврська робота