Мацькович Софія ПетрівнаДарчук Наталія ПетрівнаРобейко Валентина Василівна2024-07-162024-07-162024Мацькович С. П. Автоматичне виявлення фейкових новин на матеріалі українськомовних текстів : кваліфікаційна робота освітнього ступеня «магістр» : 035 Філологія / наук. кер. Н. Дарчук, В. Робейко. Київ, 2024. 76 с.https://ir.library.knu.ua/handle/15071834/2863Велика кількість джерел інформації та складність їхнього аналізу заохочують використовувати методи автоматичної обробки природної мови для виявлення фейкових новин. Обʼєктом дослідження є новинні тексти, написані українською мовою, а предметом — лінгвістичні ознаки фейків у них. Метою є створення застосунку для опрацювання фейкового контенту українською мовою. Для досягнення цієї мети було проаналізовано підходи до розуміння поняття “фейк”, описано загальні методи виявлення фейкових новин, досліджено способи розпізнавання оманливого контенту за допомогою обробки природної мови, проаналізовано мовні дані для створення класифікатора новин, навчено та порівняно кілька бінарних моделей для виявлення фейків та розроблено вебзастосунок. Під час здійснення дослідження було використано описовий та порівняльний методи, методи експерименту, кількісного аналізу та моделювання. Результатом роботи є створений корпус з українськомовними новинними текстами та програма-детектор фейкових новин. У новинному корпусі представлено тексти, заголовки та класи, а також метадані: дата публікації, посилання. Застосунок для виявлення фейків поєднує інтерфейс користувача з мовною моделлю на основі нейронної мережі з архітектурою довгої короткочасної памʼяті. Для оцінювання ефективності навченої моделі у дослідженні використовуються такі показники: точність, повнота, влучність та міра F1. Основними компонентами цього застосунку є тренувальні дані, модуль попередньої обробки, цикл навчання бінарного класифікатора, backend-сервер та користувацький інтерфейс. Дослідження складається з трьох розділів. Перший розділ розглядає теоретичні засади автоматичного виявлення фейкових новин. Другий розділ присвячений створенню корпусу текстів для навчання бінарних класифікаторів. Третій розділ описує розробку застосунку “Детектор фейкових новин”.The large number of information sources and the complexity of their analysis encourage the use of natural language processing to detect fake news. The object of the study is the news texts written in Ukrainian, and the subject is the linguistic features of fake news in those texts. The goal is to create an application for processing fake content in Ukrainian. To achieve this goal, the research analyses approaches to understanding the concept of a fake, describes general methods for detecting fake news, investigates ways to recognise misleading content using NLP, analyses speech data to create a news classifier; several binary models for fake news detection were trained and compared, and a web application was developed. The research was conducted using descriptive and comparative methods as well as experiment, quantitative analysis, and modelling. The result of the work is a corpus of Ukrainian-language news texts and a fake news detector. The news corpus contains texts, headlines, and classes, as well as metadata such as publication date and links. The fake news detector combines a user interface with an LSTM-based language model. To evaluate the effectiveness of the trained model, the study uses the following metrics: accuracy, completeness, precision, and F1 measure. The main components of this application are training data, a preprocessing module, a binary classifier training cycle, a backend server, and a user interface. The study consists of three chapters. The first section discusses the theoretical foundations of automatic fake news detection. The second section is devoted to the creation of a text corpus for training binary classifiers. The third section describes the development of the Fake News Detector application.uaавтоматична обробка природної мовикласифікація текстувиявлення фейкових новинглибоке навчанняnatural language processingtext classificationfake news detectiondeep learningАвтоматичне виявлення фейкових новин на матеріалі українськомовних текстівМагістерська робота