Параметри
Автоматичне виявлення фейкових новин на матеріалі українськомовних текстів
Дата випуску :
2024
Автор(и) :
Мацькович Софія Петрівна
Науковий(і) керівник(и)/редактор(и) :
Дарчук Наталія Петрівна
Робейко Валентина Василівна
Анотація :
Велика кількість джерел інформації та складність їхнього аналізу заохочують використовувати методи автоматичної обробки природної мови для виявлення фейкових новин. Обʼєктом дослідження є новинні тексти, написані українською мовою, а предметом — лінгвістичні ознаки фейків у них. Метою є створення застосунку для опрацювання фейкового контенту українською мовою. Для досягнення цієї мети було проаналізовано підходи до розуміння поняття “фейк”, описано загальні методи виявлення фейкових новин, досліджено способи розпізнавання оманливого контенту за допомогою обробки природної мови, проаналізовано мовні дані для створення класифікатора новин, навчено та порівняно кілька бінарних моделей для виявлення фейків та розроблено вебзастосунок. Під час здійснення дослідження було використано описовий та порівняльний методи, методи експерименту, кількісного аналізу та моделювання.
Результатом роботи є створений корпус з українськомовними новинними текстами та програма-детектор фейкових новин. У новинному корпусі представлено тексти, заголовки та класи, а також метадані: дата публікації, посилання. Застосунок для виявлення фейків поєднує інтерфейс користувача з мовною моделлю на основі нейронної мережі з архітектурою довгої короткочасної памʼяті. Для оцінювання ефективності навченої моделі у дослідженні використовуються такі показники: точність, повнота, влучність та міра F1. Основними компонентами цього застосунку є тренувальні дані, модуль попередньої обробки, цикл навчання бінарного класифікатора, backend-сервер та користувацький інтерфейс.
Дослідження складається з трьох розділів. Перший розділ розглядає теоретичні засади автоматичного виявлення фейкових новин. Другий розділ присвячений створенню корпусу текстів для навчання бінарних класифікаторів. Третій розділ описує розробку застосунку “Детектор фейкових новин”.
Результатом роботи є створений корпус з українськомовними новинними текстами та програма-детектор фейкових новин. У новинному корпусі представлено тексти, заголовки та класи, а також метадані: дата публікації, посилання. Застосунок для виявлення фейків поєднує інтерфейс користувача з мовною моделлю на основі нейронної мережі з архітектурою довгої короткочасної памʼяті. Для оцінювання ефективності навченої моделі у дослідженні використовуються такі показники: точність, повнота, влучність та міра F1. Основними компонентами цього застосунку є тренувальні дані, модуль попередньої обробки, цикл навчання бінарного класифікатора, backend-сервер та користувацький інтерфейс.
Дослідження складається з трьох розділів. Перший розділ розглядає теоретичні засади автоматичного виявлення фейкових новин. Другий розділ присвячений створенню корпусу текстів для навчання бінарних класифікаторів. Третій розділ описує розробку застосунку “Детектор фейкових новин”.
Бібліографічний опис :
Мацькович С. П. Автоматичне виявлення фейкових новин на матеріалі українськомовних текстів : кваліфікаційна робота освітнього ступеня «магістр» : 035 Філологія / наук. кер. Н. Дарчук, В. Робейко. Київ, 2024. 76 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
2.76 MB
Контрольна сума:
(MD5):55f826156a1f349da3e7ba9f8772506f
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC