Мороз, ОлександрОлександрМорозЛатишева, Тетяна Володимирівна2026-05-112026-05-112025Мороз О. Дослідження технології управління проєктом створення модуля нормалізації адрес в ERP-системі : кваліфікаційна робота магістра : 122 Комп’ютерні науки / наук. кер. Т. Латишева. Київ, 2025. 117 с.https://ir.library.knu.ua/handle/15071834/20221Мета кваліфікаційної роботи полягає у дослідженні, проєктуванні та впровадженні модуля нормалізації адрес та виявлення дублікатів у внутрішній ERP-системі Національного агентства з питань запобігання корупції (НАЗК) із використанням сучасних методів інтелектуального аналізу даних (LLM-моделі) та офіційних державних довідників (API Укрпошти). Ціль проєкту - провести розширений аналіз та дослідження процесів для створення інтегрованого підсистемного модуля, який забезпечує автоматизоване перетворення «сирих» текстових адрес у структурований нормалізований формат, присвоєння їм ідентифікаторів із довідників Укрпошти, а також виявлення й обробку дубльованих записів у довіднику адрес ERP-системи. Це дозволяє підвищити якість адресних даних, зменшити кількість помилок при обробці документів та забезпечити надійну аналітику на рівні НАЗК. Наукова новизна - побудова концептуально моделі рішення для автоматизованої нормалізації адрес, що інтегрує довідник Укрпошти з методами обробки неструктурованих даних. Практична цінність роботи полягає у розробці реального прототипу модуля, орієнтованого на впровадження в інформаційне середовище НАЗК. Модуль забезпечує автоматизовану очистку історичних («legacy») адресних записів із застосуванням LLM-моделі ChatGPT 5, синхронізацію з довідниками Укрпошти, контроль унікальності через складені індекси та інтерфейс для адміністрування дублікатів. Використання запропонованого рішення знижує трудомісткість ручної обробки, скорочує кількість неструктурованих і помилкових адрес у базі даних та створює основу для подальшої автоматизації процесів документообігу й аналітики в агенції. Кваліфікаційна робота складається з анотації, вступу, основної частини, що включає чотири розділи, висновків та переліку використаних джерел. У першому розділі розглянуто теоретичні та нормативні засади роботи з адресними даними: проаналізовано вимоги до структури адрес, підходи до нормалізації й унікалізації, а також оглянуто наявні системи та сервіси (зокрема API Укрпошти). Виконано аналіз поточного стану адресного довідника ERP-системи НАЗК, виявлено основні проблеми (наявність застарілих, неструктурованих і дубльованих записів), побудовано дерево проблем і дерево цілей, визначено зацікавлені сторони та сформульовано вимоги до майбутнього модуля. Другий розділ присвячено методологічним та проєктним засадам створення модуля. Обґрунтовано вибір ітеративного підходу до управління проєктом із використанням елементів Agile/Scrum. Розроблено нові концептуальні моделі інформаційної системи та адресного модуля, формалізовано задачу нормалізації адрес як перетворення текстового рядка у структурований запис із посиланнями на довідники. Окрему увагу приділено вибору технологічного стеку (C#, .NET, MSSQL, Python, LLM) та обґрунтуванню використання LLM-моделі ChatGPT 5 як інструмента для семантичного розбору неструктурованих адрес. У третьому розділі розроблено архітектуру програмного забезпечення: описано багатошарову структуру модуля нормалізації, концептуальну та фізичну моделі бази даних, механізми інтеграції з ERP-системою та API Укрпошти. Наведено логіку роботи основних компонентів - інтерфейсу адміністратора (вкладки «Ненормовані адреси» та «Дублі»), сервісу нормалізації, підсистеми виявлення дублікатів, журналювання змін. Сформульовано алгоритм виявлення дублікатів на основі нормалізованих полів та складеного унікального індексу, а також описано концептуальну модель процесу нормалізації legacy-записів із застосуванням LLM-моделі й подальшою валідацією через довідники Укрпошти. Четвертий розділ містить результати практичної реалізації та дослідження ефективності запропонованого рішення на реальних даних НАЗК. Детально описано процес фільтрації ненормованих записів за допомогою SQL-запитів, підготовки навчальних прикладів, масової обробки адрес за допомогою ChatGPT 5, ручної експертної валідації та присвоєння ідентифікаторів з довідників. Показано, що кількість записів із неповним набором структурних компонентів було скорочено з 19826 до 7094, з яких більшість записів виявилися нерелевантними й підлягають видаленню. Проведено оцінку організаційного та економічного ефекту: зменшення обсягу ручної роботи, зниження ризиків помилок у документах, підвищення якості та цілісності адресних даних. Робота завершується узагальнюючими висновками щодо досягнення поставленої мети й виконання всіх завдань дослідження, а також рекомендаціями стосовно подальшого розвитку модуля: масштабування на інші реєстри, розширення функцій аналітики та використання спеціалізованих моделей, навчених на українських адресних даних. Кваліфікаційна робота складається з 101 сторінки основного тексту, містить 19 рисунків, 3 формули, 3 додатки. Ключові слова: нормалізація адрес, якість даних, ERP-система, НАЗК, адресний довідник, великі мовні моделі, ChatGPT, API Укрпошти, виявлення дублікатів, очищення даних, управління проєктами.ukнормалізація адресякість данихERP-системаНАЗКадресний довідниквеликі мовні моделіChatGPTAPI Укрпоштивиявлення дублікатівочищення данихДослідження технології управління проєктом створення модуля нормалізації адрес в ERP-системіМагістерська робота