Параметри
Множинне заповненння пропусків як метод боротьби з пропущеними даними
Дата випуску :
2022
Автор(и) :
Губар Артем Андрійович
Анотація :
У першому розділі розглянуто теоретичні підходи до методів заповнення (імпутації) пропущених даних, а також типи пропусків та проблеми при їх імпутації. Проаналізовано різні підходи до аналізу пропусків у датафреймах та аналіз їх якості. В роботі розглянуто 3 методи заповнення пропущених даних: регресійна модель, Байєсівська стохастична регресійна імпутація, множинна імпутація пропущених даних за методикою Рубіна. Досліджено адекватність застосування алгоритмів заповнення для пропусків різного походження: повністю випадкових пропусків (MCAR) та систематичних пропусків, розподіл яких залежить як від пропущених значень, так і від спостережуваних ознак (MNAR). У другому розділі реалізована генерація даних з різними типами пропусків та заповнення їх описаними методами. Генерація реалізована за допомогою програмної мови R пакетів для роботи з пропущеними даними: mice та naniar.
Бібліографічний опис :
Губар А. А. Множинне заповненння пропусків як метод боротьби з пропущеними даними : кваліфікаційна робота бакалавра : 124 Системний аналіз / Губар Артем Андрійович. - Київ, 2022. - 46 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
1.01 MB
Контрольна сума:
(MD5):473c0238be2cabb7d9a4c26639f9e5a4
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC