Райчук Ісус ВасильовичХлевна, Юлія Леонідівна2025-05-232025-05-232025-05-21Райчук І. В. Моделі та методи управління потоками персональних даних суб’єктів освітнього середовища в умовах діджиталізації : дис. … доктора філософії : 122 Комп’ютерні науки / Райчук Ісус Васильович ; наук. кер. Ю. Л. Хлевна. Київ, 2025. 250 с.https://ir.library.knu.ua/handle/15071834/6525Актуальність теми дослідження управління потоками персональних даних суб’єктів освітнього середовища в умовах діджиталізації зумовлена стрімким розвитком цифрових технологій, які змінюють підходи до обробки та захисту персональних даних у сфері освіти. У сучасному світі освітні установи стикаються з дедалі більшою кількістю інформаційних потоків, що містять персональні дані студентів, викладачів і співробітників. Ефективне управління цими потоками є ключовим для підтримки стабільності та безпеки всього освітнього процесу. Діджиталізація в галузі освіти відкриває нові можливості для оптимізації навчальних процесів, робить можливим персоналізоване навчання та сприяє глобалізації освіти. Проте, разом із цими перевагами з’являються й нові виклики, зокрема суттєвий ризик порушення конфіденційності та несанкціонованого використання персональних даних. Управління ризиками витоку персональних даних – один з елементів підтримки стабільної роботи освітніх середовищ та збереження довіри до них. Трансформація освітнього середовища у бік цифровізації вимагає не лише обробки даних, але й забезпечення їхнього захисту на всіх етапах. У зв'язку з цим, розробка надійних моделей і методів та інформаційної технології управління потоками персональних даних стає необхідністю. Окрему увагу слід приділити невідповідності між зростаючим обсягом потоків даних та наявними технічними засобами зберігання. Відсутність принципів управління збереженням таких потоків може призвести до зниження ефективності управлінських рішень в освітньому середовищі, а також до ризиків безпеки та збереження інформації. Тому своєчасним є питання моделювання управління зберіганням потоків даних в освітньому середовищі, в основі якого прогнозування апаратних вимог і оцінка показових переваг до зберігання потоків даних. Таким чином, дослідження в цій галузі є не лише актуальним, але й має потенціал для започаткування нових практик і політик в управлінні даними, що мають критичне значення як для розвитку освітньої сфери, так і для суспільства в цілому. Це дослідження пропонує рішення, які можуть бути застосовані у багатьох секторах, інтегруючись у ширші стратегії інформаційної безпеки та управління ризиками в умовах цифрової трансформації. Виникає актуальна науково-прикладна проблема, пов’язана зі створенням та застосуванням моделей, методу управління потоками персональних даних освітнього середовища в умовах діджиталізації, що направлено на підвищення рівня захищеності персональної інформації учасників навчального процесу та забезпечення якісних та ефективних механізмів підвищення конфіденційності такого процесу, з урахуванням ризиків, а також викликів. Зважаючи на це, проведено аналіз, за результатами якого встановлено, що з розвитком цифрових технологій, обсяг даних, які збираються про учасників навчального процесу, стрімко зростає. Це включає інформацію про академічні досягнення, поведінкові дані в навчальних системах, особисті дані студентів та викладачів, дані про взаємодію з навчальними платформами, а також адміністративні дані. Таке накопичення інформації вирізняється складністю та обсягами, ставлячи перед системами освіти задачу постійного вдосконалення управлінських практик і технологій збереження даних. Хоча ці дані є вкрай важливими для аналізу і покращення якості навчання, їх зберігання й обробка несе ризики, пов’язані з витоками даних та несанкціонованим доступом. Збільшення обсягу даних створює необхідність їх ефективного менеджменту, оскільки несанкціоноване використання таких даних може мати серйозні наслідки як для окремих учасників навчального процесу, так і для установ загалом. Незважаючи на різноманітні підходи до захисту інформації, такі як шифрування, захист мережевих протоколів і автентифікація користувачів, вони здебільшого зосереджені на захисті вже зібраних даних та каналів їх передачі. На противагу цьому, концепція анонімізації пропонує не лише захист, а й профілактику витоків, оскільки дані стають такими, які неможливо розпізнати з самого початку. Це означає, що дані, які можуть бути корисними для освітніх аналітиків, дослідників та адміністраторів, не можуть бути пов'язаними з конкретними особами, що значно ускладнює можливості їх несанкціонованого використання. Зокрема, дослідивши цей напрямок детально, варто зазначити, що методи анонімізації можуть включати техніки заміни, генерації псевдонімів, агрегування, та інші способи зміни структури даних. Це дозволяє зберігати інформацію, що є важливою для навчального аналізу, при цьому забезпечуючи приватність осіб. Однак, проведений аналіз показує, що анонімізація не є широко розповсюдженим підходом у сфері освіти. Значна частина навчальних закладів все ще не має чітких методик її впровадження, що є наслідком відсутності достатньої кількості досліджень і документальних прикладів успішного використання таких підходів. Як результат, заклади освіти часто обмежуються стандартними методами захисту, які не забезпечують достатнього рівня безпеки у сучасному діджиталізованому світі. Крім того, впровадження методик анонімізації стикається з технічними та організаційними викликами через відсутність системного бачення та стандартів у цій сфері. Для навчальних установ критично важливо мати уніфіковані підходи та інструменти, які можна інтегрувати у вже наявні системи управління навчанням. Це дозволило б ефективно захищати дані, використовуючи новітні технології та методики. Все це вказує на необхідність розробки моделей та методів, які б дозволили освітнім установам впроваджувати управління потоками персональних даних суб’єктів освітнього середовища в умовах діджиталізації на всіх етапах збереження та обробки даних. Зокрема, такі моделі та методи повинні враховувати різні рівні конфіденційності даних, типи освітніх систем, а також технологічні можливості конкретних навчальних закладів. Метою цієї дослідницької роботи є підвищення ефективності управління потоками персональних даних освітнього середовища в умовах діджиталізації за рахунок розробки моделей, методу та інформаційної технології захисту персональних даних учасників освітнього процесу. Дослідження у цьому напрямку також сприятиме довірі між учасниками навчального процесу, включаючи студентів, викладачів та адміністрацію, забезпечуючи при цьому відповідність сучасним стандартам інформаційної безпеки. Для реалізації цих цілей вирішено ряд науково-прикладних завдань: ● аналіз існуючих підходів до управління інформаційними потоками освітнього середовища у контексті діджиталізації; ● розробка концепції управління потоками персональних даних у контексті діджиталізації освітньої сфери, в основі якої модель інформаційних потоків та інформаційних взаємодій у діджиталізованій освітній сфері; ● формування моделі управління зберіганням потоків даних освітнього середовища; ● запропонувати модель ризиків витоку персональних даних при інформаційній взаємодії діджиталізованого освітнього середовища; ● розробка методу управління потоками персональних даних в умовах діджиталізації освітньої сфери; ● розробка, застосування інформаційної технології управління потоками персональних даних освітнього середовища в умовах діджиталізації та визначення її ефективності. Дослідження в рамках цієї роботи базуватимуться на існуючих актуальних напрацюваннях у сфері освіти, захисту інформації, зокрема й анонімізації даних персональної інформації. Планується детально проаналізувати сучасні методики та інструменти, які вже були застосовані в інших сферах, з метою адаптації їх до освітнього контексту. Крім того, розроблена методологія анонімізації даних буде впроваджена в межах однієї з великих існуючих навчальних платформ. Це дозволяє не лише перевірити ефективність запропонованих підходів, а й отримати цінний практичний досвід, який може бути використано для подальшого вдосконалення системи захисту даних в освітній сфері.The relevance of research on the management of personal data flows of subjects of the educational environment in the context of digitalization is due to the rapid development of digital technologies, which are changing approaches to the processing and protection of personal data in education. In the modern world, educational institutions are faced with increasing information flows containing the personal data of students, teachers, and employees. Effective management of these flows is key to maintaining the stability and security of the entire educational process. Digitalization in the field of education opens up new opportunities for optimizing educational processes, makes personalized learning possible, and contributes to the globalization of education. However, along with these advantages, new challenges also arise, in particular, a significant risk of breach of confidentiality and unauthorized use of personal data. Managing the risks of leakage of personal data is one of the elements of supporting the stable operation of educational environments and maintaining trust in them. The transformation of the educational environment towards digitalization requires not only data processing but also ensuring their protection at all stages. In this regard, the development of reliable models and methods and information technology for managing personal data flows becomes a necessity. Special attention should be paid to the discrepancy between the growing volume of data flows and the available technical means of storage. The lack of principles for managing the storage of such flows can lead to a decrease in the effectiveness of management decisions in the educational environment, as well as to security and information security risks. Therefore, the issue of modeling the storage management of data flows in the educational environment, based on the prediction of hardware requirements and the assessment of the indicative advantages of storing data flows, is timely. Research and implementation of modern information technologies for managing personal data flows is one of the identified areas of development of the educational environment in the context of digital transformation. The development of specialized models is aimed not only at increasing the efficiency of storing data flows but also at ensuring their protection at all stages of the life cycle. Information technology based on such approaches will allow achieving a new level of automation and reliability in personal data management. This will contribute to improving the quality of the educational process, preserving the confidentiality of participants, and ensuring the security of information systems. This topic is also important because it requires compliance with regulatory requirements for the protection of personal data, such as the General Data Protection Regulation (GDPR) in the European Union and other Ukrainian laws. Educational institutions that do not provide an adequate level of data security risk losing the community's trust and incurring financial losses through fines. Theoretical and applied aspects of developing a method, models and algorithms for managing information flows in the context of digitalization of the educational sphere in order to increase the level of security of the educational process are presented in the works: P. Petrov, I. Kuyumdzhiev, Susanti, Ani Widyawati, Svitlana Bader, Alla Oleksiienko, Kochkareva I. V., Cramarenco R. E., Burcă-Voicu M. I., Martyniuk O.O., Martyniuk O.S, Zhen-Yu Wu, Gunawan D., Mambo M., Fengjun Li, Xukai Zou, J. Ma, Mygal V., Lovecek T., Ristvej J., Minzhu Zhang. All this indicates the feasibility of managing personal data flows in the educational environment in the context of digitalization in the form of a software solution. Thus, research in this area is not only relevant but also has the potential to introduce new practices and policies in data management that are critical to the development of the educational sphere and society as a whole. This research suggests solutions that can be applied across multiple sectors, integrating into broader information security and risk management strategies in the context of digital transformation. There is a pressing scientific and applied problem related to the creation and application of models and methods for managing flows of personal data in the educational environment in the digitalized environment. This problem aims to increase the security of participants' personal information in the educational process and ensure high-quality and effective mechanisms for increasing the confidentiality of such a process, taking into account risks and challenges. Because of this, an analysis was conducted, the results of which showed that with the development of digital technologies, the volume of data collected about participants in the educational process is rapidly growing. This includes information on academic achievements, behavioral data in educational systems, personal data of students and teachers, data on interaction with educational platforms, as well as administrative data. Such accumulation of information is distinguished by its complexity and volume, setting before education systems the task of constantly improving management practices and data storage technologies. Although this data is crucial for analyzing and improving the quality of education, its storage and processing carry risks associated with data leaks and unauthorized access. The increase in the volume of data creates the need for its effective management, as unauthorized use of such data can have serious consequences for both individual participants in the educational process and institutions as a whole. Despite various approaches to information security, such as encryption, network protocol protection, and user authentication, they mostly focus on protecting the data already collected and its transmission channels. In contrast, the concept of anonymization offers not only protection but also prevention of leaks, as the data becomes unrecognizable from the very beginning. This means that data that can be useful for educational analysts, researchers, and administrators cannot be associated with specific individuals, which greatly complicates the possibility of their unauthorized use. In particular, having studied this area in detail, it is worth noting that anonymization methods can include substitution techniques, pseudonym generation, aggregation, and other ways of changing the data structure. This allows you to preserve information that is important for educational analysis while maintaining the privacy of individuals. However, the analysis shows that anonymization is not a widespread approach in the field of education. A significant part of educational institutions still does not have clear methods for its implementation, which is a consequence of the lack of sufficient research and documented examples of the successful use of such approaches. As a result, educational institutions are often limited to standard protection methods that do not provide a sufficient level of security in the modern digital world. In addition, the implementation of anonymization methods faces technical and organizational challenges due to the lack of a systemic vision and standards in this area. It is critically important for educational institutions to have unified approaches and tools that can be integrated into existing learning management systems. This would allow for effective data protection using the latest technologies and techniques. All this indicates the need to develop models and methods that would allow educational institutions to implement the management of personal data flows of subjects of the educational environment in the conditions of digitalization at all stages of data storage and processing. In particular, such models and methods should take into account different levels of data confidentiality, types of educational systems, as well as technological capabilities of specific educational institutions. The purpose of this research work is to increase the efficiency of managing personal data flows in the educational environment in the conditions of digitalization by developing models, methods, and information technology for the protection of the personal information of participants in the educational process. Research in this direction will also contribute to trust between participants in the educational process, including students, teachers, and administration while ensuring compliance with modern information security standards. To achieve these goals, it is necessary to solve several scientific and applied tasks: ● analysis of existing approaches to managing information flows in the educational environment in the context of digitalization; ● development of a concept for managing personal data flows in the context of digitalization of the educational sphere, based on a model of information flows and information interactions in the digitalized educational sphere; ● formation of a model for managing the storage of data flows in the educational environment; ● propose a model of personal data leakage risks during information interaction in the digitalized educational environment; ● development of a method for managing personal data flows in the context of digitalization of the educational sphere; ● development, application of information technology for managing personal data flows in the educational environment in the context of digitalization, and determination of its effectiveness. Research within the framework of this work will be based on existing current developments in the field of education, and information protection, in particular, anonymization of personal information data. It is planned to analyze in detail modern methods and tools that have already been applied in other areas, to adapt them to the educational context. In addition, the developed methodology for data anonymization will be implemented within one of the large existing educational platforms. This allows not only to verify the effectiveness of the proposed approaches but also to gain valuable practical experience that can be used to further improve the data protection system in the educational sphere. Thus, the paper analyzes existing approaches to managing information flows in the educational environment in the context of digitalization. In particular, the work in the following areas is analyzed: the impact of digitalization on information flows in the educational sphere, existing approaches to managing information flows in the digitalized educational sphere, existing models and information solutions for protecting personal data in the digitalized educational sphere, problematic tasks of managing information flows in the digitalized educational sphere and the use of anonymization to protect personal data in information flows in the educational sphere. A concept for managing personal data flows in the context of digitalization of the educational sphere has been developed. In the context of this, a scheme of information flows of the digitalized educational environment in the context of the distribution of personal data of its stakeholders has been created and described in detail. The main stakeholders of information interaction in the digitalized educational sphere have been identified. After that, based on the analysis of information interactions in the digitalized educational environment and the formation of categories of stakeholders in the educational process, a model of information interaction in the digitalized educational sphere was developed. Having received a sufficient information basis, a model for determining the leakage of personal data of digitalized information interaction was built. This model allows us to understand the main points of control of personal data flows. A model of risks of personal data leakage in information interaction in the digitalized educational environment was created. The model demonstrates the zone of occurrence of risk events of personal data leakage. In addition, an expert assessment of the causes of personal information leakage and its possible consequences was carried out. After that, the main probable causes of personal data leakage events were identified. Having understood the main risks associated with the leakage of personal data of stakeholders of digitalized education, principles were created to minimize the distribution of personal data of participants in the educational process. The next step was the formation of a model for managing the storage of data flows in the educational environment. The model makes it possible to prepare for deciding on the location of an educational institution's information flows, which is an important factor from the point of view of protecting the personal information of stakeholders in the educational process. Personal data flow management models have been created in the context of the digitalization of the educational sphere. These include a model of anonymization of stakeholders' personal data in information flows during information interaction in a digitalized educational environment, as well as a model of anonymization of stakeholders' personal data in information flows during information interaction in a digitalized educational environment. These models demonstrate which data should leave the boundaries of the digital system of the educational institution and which should not. The anonymization model also shows what information will be returned to the educational institution. In turn, the digitalization model describes the rules of information interaction when external platforms request data de-anonymization. A method of managing personal data flows in the context of digitalization of the educational sphere has been developed. The method describes in detail the implementation and use of software for anonymization and de-anonymization of personal information of the main information objects of the educational space (Student, Teacher, Administrator, and others). Within the framework of the created method, the following was done: ● an algorithm for anonymizing the personal data of stakeholders of digitalized education was created, which step by step describes each stage of creating and integrating an anonymization service into the digital data management system of the educational institution, starting with planning and ending with creating final reports; ● an algorithm for deanonymizing the personal data of stakeholders of digitalized education was created, which in turn describes the steps that must be taken to develop and implement a deanonymization service into the digital management system of the educational institution; ● a general scheme for implementing anonymization and deanonymization of personal data in the information space of digitalized education was created and described; ● a method for anonymizing personal data in the interaction of elements of the information space of digitalized education was developed and described in detail; it can be used separately from the general method, but in most cases, anonymization does not make sense without deanonymization; ● a method of deanonymization of personal data in the interaction of elements of the information space of digitalized education was created, which allows the implementation of a deanonymization service, but it has meaning only if anonymization has been previously implemented; ● the methods of anonymization and deanonymization of personal data were combined and based on them a method of simultaneous implementation of anonymization and deanonymization of personal data in the interaction of elements of the information space of digitalized education was obtained. An information technology for managing flows of personal data of the educational environment in the conditions of digitalization was developed and applied and its effectiveness was determined. In particular, it was: ● created an information technology architecture for anonymization and de-anonymization of personal data of stakeholders of digitalized education, which includes a general scheme of the information technology architecture, requirements for the components of the information technology architectural solution, and the database structure; ● software for anonymization and deanonymization of personal data of stakeholders of digitalized education was implemented; ● information technology for anonymization and deanonymization of personal data was applied; ● an assessment of the effectiveness of the application of information technology for managing personal data flows in the educational environment in the context of digitalization was carried out.ukУправлінняперсональні даніпотоки данихідентифікація ризиківанонімізаціядеанонімізаціязахист персональних данихрекомендації щодо захисту персональних данихпередача інформаціїкласифікація інформаційних потоківінформаційні загрозипідтримка прийняття рішеннярозташування інформаційних потоківзменшення ризиків втратінформаційна технологія.managementpersonal datadata flowsrisk identificationanonymizationde-anonymizationpersonal data protectionrecommendations for personal data protectioninformation transferclassification of information flowsinformation threatsdecision supportdata flow placementrisk reduction of lossinformation technologyМоделі та методи управління потоками персональних даних суб’єктів освітнього середовища в умовах діджиталізаціїModels and methods of managing personal data flows of subjects of the educational environment in the conditions of digitalizationДисертація