Розора Ірина ВасилівнаГубар Артем Андрійович2023-10-022024-05-152023-10-022022Губар А. А. Множинне заповненння пропусків як метод боротьби з пропущеними даними : кваліфікаційна робота бакалавра : 124 Системний аналіз / Губар Артем Андрійович. - Київ, 2022. - 46 с.https://ir.library.knu.ua/handle/123456789/4889У першому розділі розглянуто теоретичні підходи до методів заповнення (імпутації) пропущених даних, а також типи пропусків та проблеми при їх імпутації. Проаналізовано різні підходи до аналізу пропусків у датафреймах та аналіз їх якості. В роботі розглянуто 3 методи заповнення пропущених даних: регресійна модель, Байєсівська стохастична регресійна імпутація, множинна імпутація пропущених даних за методикою Рубіна. Досліджено адекватність застосування алгоритмів заповнення для пропусків різного походження: повністю випадкових пропусків (MCAR) та систематичних пропусків, розподіл яких залежить як від пропущених значень, так і від спостережуваних ознак (MNAR). У другому розділі реалізована генерація даних з різними типами пропусків та заповнення їх описаними методами. Генерація реалізована за допомогою програмної мови R пакетів для роботи з пропущеними даними: mice та naniar.uaМножинне заповненння пропусків як метод боротьби з пропущеними данимиБакалаврська робота