Порівняльний аналіз системних журналів і потокових даних алгоритми виявлення аномалій

Ліщитович, А.; Павленко, В.; Шматок, О.; Фіненко, Ю.

doi:10.17721/ISTS.2020.1.50-59

Порівняльний аналіз системних журналів і потокових даних алгоритми виявлення аномалій

Тип публікації :

Стаття

Дата випуску :

1 лютого 2020 р.

Автор(и) :

Ліщитович, А.

Відкритий міжнародний університет розвитку людини "Україна"

Павленко, В.

Відкритий міжнародний університет розвитку людини "Україна"

Шматок, О.

Відкритий міжнародний університет розвитку людини "Україна"

Фіненко, Ю.

Відкритий міжнародний університет розвитку людини "Україна"

Мова основного тексту :

Ukrainian

eKNUTSHIR URL :

https://ir.library.knu.ua/handle/15071834/12635

DOI :

10.17721/ISTS.2020.1.50-59

Журнал :

Безпека інформаційних систем і технологій

Випуск :

1(2)

ISSN :

2707-1758

Початкова сторінка :

50

Кінцева сторінка :

59

Цитування :

[APA 7] Ліщитович, А., Павленко, В., Шматок, О., & Фіненко, Ю. (2020). Comparative analysis of system logs and streaming data anomaly detection algorithms. Безпека інформаційних систем і технологій, (1(2)), 50–59. https://doi.org/10.17721/ISTS.2020.1.50-59

[ДСТУ] Comparative analysis of system logs and streaming data anomaly detection algorithms / А. Ліщитович et al. Безпека інформаційних систем і технологій. 2020. no. 1(2). P. 50—59. DOI: 10.17721/ISTS.2020.1.50-59 (date of access: 17.07.2026).

У цьому документі подано опис та порівняльний аналіз
декількох загальноприйнятих підходів до аналізу системних журналів та
потокових даних, що масово генеруються ІТ-інфраструктурою компанії, та
виявленню аномалій. Важливість виявлення аномалії продиктована
зростаючими витратами у випадку простою системи через події, які могли
б бути передбачені на основі записів журналу з попереджувальними
даними. Системи виявлення аномалій побудовані за допомогою
стандартного процесу збору даних, аналізу, вилучення інформації та
виявлення відхилень. Виявлення аномальної поведінки системи відіграє
важливу роль у масштабних системах управління інцидентами. Своєчасне
виявлення дозволяє ІТ-адміністраторам швидко виявити проблеми та
негайно їх вирішити. Такий підхід значно скорочує час простою системи.
Більшість ІТ-систем генерують журнали з детальною інформацією про
операції. Тому журнали стають ідеальним джерелом даних рішень
виявлення аномалії. Обсяг журналів унеможливлює їх аналіз вручну та
вимагає автоматизованих підходів.Більша частина документа стосується
кроку виявлення аномалії та таких алгоритмів, як регресія, дерево рішень,
SVM, кластеризація, аналіз основних компонентів, видобуток інваріантів та
ієрархічна модель тимчасової пам'яті. Алгоритми пошуку аномалії, що
базуються на моделях, та ієрархічні алгоритми тимчасової пам'яті
використовувались для обробки наборів даних HDFS, BGL та NAB з ~16
млн. повідомленнями журналу та ~365 тис. точками потокових даних. Дані
були вручну позначені мітками, щоб дозволити навчання моделей та
розрахунок точності їх роботи. Відповідно до результатів, системи
контрольованого виявлення аномалій досягають високої точності, але
потребують значних зусиль для тренувань моделей, тоді як алгоритм на
основі HTM моделі показує найвищу точність виявлення при відсутності
тренування.

Ключові слова :

detection of anomalies system logs decision tree clustering data analysis hierarchical temporal memory виявлення аномалій системні журнали дерево прийняття рішень кластеризація аналіз даних ієрархічна часова пам’ять

Галузі знань та спеціальності :

12 Інформаційні технології

Галузі науки і техніки (FOS) :

Інженерія та технології

Файл(и) :

Формат :

Adobe PDF

Розмір :

985.82 KB

Контрольна сума :

(MD5):c7f84ab5bad9b9560d9bd8c5be7db8c2

Якщо не вказано інше, ця робота розповсюджується на умовах ліцензії Creative Commons Attribution 4.0 International